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Abstract of WO2004063358 

The invention relates to a method for producing a 
genetically modified organism of the genus 
Blakeslea, said method comprising the following 
steps: (i) at least one of the cells is transformed, 
(ii) the cells obtained in step (i) are optionally 
rendered homokaryotic, so that cells are created 
in which the nuclei are all homogeneously 
modified In at least one genetic characteristic and 
convert said genetic modification into an 
expression, and (iii) the genetically modified cell 
or cells are selected and cultivated. 




Data supplied from the esp@cenet database - Worldwide 



http://v3.espacenet.com/textdoc?DB=EPODOC&IDX=WO2004063358&F=0 11/29/2006 



(12) NACH DEM VERTRAG UBER DIE INTERNATIONALE ZUSAMMENARBEIT AUF DEM GEBBET DES 
PATENTWESENS (PCT) VEROFFENTLICHTE INTERNATIONALE ANMELDUNG 



(19) Weltorganisation fur geistiges Eigentum 
Internationales Btiro 




lllllllllllllllllllilllllllllllllll 



(43) Internationales VerSffentUchungsdatum (10) Internationale VerBffentlichungsmimmer 

29. JvOi 2004 (29,07.2004) PCT WO 2004/063358 Al 



PCT/EP2004/000100 

9. Januar 2004 (09.01 .2004) 
Deutsch 



(21) 
(22) 

(25) 

(26) Veroffentlichungssprache: Deutsch 

(30) Angaben ssur Prioritat: 

103 00 649.4 9. Januar 2003 (09.01.2003) DE 

103 41 272.7 8. September 2003 (08.09.2003) DE 

(71) Anmetder (ftir alle Bestimmungsstaatm mit Ausnahme 
! von US): BASF AKTIENGESELLSCHAFT 
\ 67056 Ludwigshafen (DE). 



(72) Erflnder; und 

(75) Erfinder/Anmelder (nur fir US): MATUSCHEK, 
Markus [DE/DE]; Karolinenstr. 5, 69469 Weinheim 
(DE). HEENEKAMP, Thorsten [DE/DE]; Alte Ziegelei 
lb, 38410 Hannover (DE). SCHMIDT, Andre [DE/DE]: 
Magdeburger Sir. 1 1, 31832 Springe (DE). BRAKHAGE, 
Axel [DE/DE]; Schneiderberg 58, 38167 Hannover (DE). 

(74) Anwait: FITZNER, Uwe; Lintorfer Strasse 10, 40878 
Ratingen (DE). 

(81) Bestiminungsstaaten (soweit nicht artders angegeben, fur 
jede verfiigbare naiionale Schutzrechtsart): AE, AG, AL, 
AM, AT, AU, AZ, BA, BB, BG, BR, BW, BY, BZ, CA, CH, 
CN, CO, CR, CU, CZ, DE, DK, DM, DZ, EC, EE, EG, ES, 
FT, GB, GD, GE, GH, GM, HR, HU, ID, IL, IN, IS, JP, KE, 
KG, KP, KR, KZ, LC, LK, LR, LS, LT, LU, LV, MA, MD, 
MG, MK, MN, MW, MX, MZ, NA, NT, NO, NZ, OM, PG, 

[Fortsetzung aufder nSchsten Seite] 



\ (54) Title: METHOD FOR THE GENETIC MODIFICATION OF ORGANISMS OF THE GENUS BLAKESLBA, CORRE- 
| SPONDING ORGANISMS, AND THE USE OF THE SAME 



\ (54) Bezeicbnung: VERFAHREN ZUR GENTECHNISCHEN VERANDERUNG VON ORGANISMEN DER GATTUNG BLA 
= KESLBA, ENTSPRECHENDE ORGANISMEN UND DEREN VERWENDUNG 



VEKTOR pBirtAHyg 



00 
if) 




? (57) Abstract: The invention relates to a method for producing a genetically modified organism of the genus Blakeslea, said method 
J comprising the following steps: (i) at least one of the cells is transformed, (ii) the cells obtained an step (i) are optionally rendered 
homokaryotic, so that cells are created in which the nuclei are all homogeneously modified in at least one genetic characteristic and 
? convert said genetic modification into an expression, and (iii) the genetically modified cell or cells are selected and cultivated. 
t [Foriseizung aufder niichsten Seite] 



(12) NACH DEM VERTRAG UBER DIE INTERNATIONALE ZUSAMMENARBEFT AUF DEM GEBIET DES 
PATENTWESENS (PCX) VKKCU'l h.M i ll H I \: IN I KKiNAl IO.N Al.h ANMELDUISG 



(43) Internationales Veroffentiichurtgsdalum d<>) Internationale VeroffentHchungsmunmer 

29. Juli 2004 (29.07.2004) PCT WO 2004/063358 Al 



(21) Internationales Aktenzeichen: PCT/EP2O04/O001OO 



(26) Veroffentlichimgssprache: Deutsch 

(30) Angaben zur Prioritat: 

103 00 649.4 9. Januar 2003 (09.01 .2003) DE 

103 41 272.7 8. September 2003 (08.09.2003) DE 

(71) Anmelder (fur alle Bestimmungsstaaten mit Ausnahme 
i von US): BASF AKTEENGESELLSCHAFT [DE/DE]; 
| 67056 Ludwigshafen (DE). 



(72) Erfinder; und 

(75) Erflnder/Anmelder (nur fiir US): MATUSCHEK, 
Markns [DE/DE]; Karolinenstr. 5, 69469 Weinheim 
(DE). HEINEKAMP, Thorsten [DE/DE]; Alte Ziegelei 
lb. 38419 Hannover (DE). SCHMIDT, Andre [DE/DE1; 
Magdeburger Sir. 1 1 , 3 1 832 Springe (DE). BRAKHAGE, 
Axel [DE/DE]; Schneiderberg 58, 38167 Hannover (DE). 

(74) Amralt: FITZNER, Uwe; Lintorfer Strasse 10, 40878 
Ratingen (DE). 



n (soweit nicht an 
jede verfugbare nationale Schutzrechtsart); AE, AG, AL, 
AM, AT, AU, AZ, BA, BB, BG, BR, BW, BY, BZ, CA, CH, 
CN, CO, CR, CU, CZ, DE, DK, DM, DZ, EC, EE, EG, ES, 
FI, GB, GD, GE, GH, GM, HR, HU, ID, IL, IN, IS, JP, KE, 
KG, KP, KR, KZ, LC, LK, LR, LS, LT, LU, LV, MA, MD, 
MG, MK, MN, MW, MX, MZ, NA, NI, NO, NZ, OM, PG, 

[Fortsetzung auf dernachsten Seite) 



I (54) Titlei METHOD FOR THE GENETIC MODIFICATION OF ORGANISMS OF THE GENUS BLAKESLEA, CORRE- 
\ SPONDtNG ORGANISMS, AND TOE USE OF THE SAME 



I 5 -' Braeichmrag: VERFAHREN ZUR GENTECHNISCHEN VERANDERUNG VON ORGANISMEN DER GATTUNG BLA- 
f KESLEA, ENTSPRECHENDE ORGANISM] I 1 Rl "JVERWENDUNG 



VEKTOR pBinAHyg 

SM (15735)1 
'fa (15713) 
T-DNA left border (149B9-151 38 bp) 



rrotlt(11222-ia)1Sb<i}_ 



00 
IT) 




2 (57) Abstract: The invention relates to a method for produc no . genetically modified organism of the genus Blakeslea, said method 
^ comprising the following steps: (i) at least one of the cefls is transformed, (ii) the cells obtained in step (i) are optionally rendered 
homokaryotic, so that cells are created in which the nuclei are all homogeneously modified in at least one genetic characteristic and 
O convert said genetic modification into an expression, and (iii) the genetically modified cell or cells are selected and cultivated. 

[Futlseliung auf del nachsten Setts] 



WO 2004/063358 Al IKK iliiliiiilllllllillllHIl'Jirilllllllill 



PH, PL, FT, RO, RU, SC, SD, SB, SG, SK, SL, SY, TJ, TO, 
TO, TR, TT, TZ, UA, UG, US, UZ, VC, VN, YU, ZA, ZM, 

zw. 

(84) Bestiinrnungsstaaten (soweit nichl anders angegeben, fur 
jede verftlgbare regianale Schutzrechtsart): AKTPO (BW, 

GH, GM, KB, LS, MW, MZ, SD, SL, SZ, TZ, UG, ZM, 
ZW), eurasisches (AM, AZ, BY, KG, KZ, MD, RU, TJ, 
TM), europaisches (AT, BE, BG, CH, CY, CZ, DE, DK, 
EE, ES, FI, PR, GB, GR, HU, IE, IT, LU, MC, NL, PT, 
RO, SE, SI, SK, TR), OAPI (BE, BJ, CF, CG, CI, CM, GA, 
GN, GQ, GW, ML, MR, NE, SN. TD, TG). 
Vexijffentlfcht; 

— mil iniernationalem Recherchenbericht 



— vor Ablauf der fur Anderungen der Anspriiche geltenden 
Frist; Veroffentlichung wird wiederhok, falls Anderungen 
eintreffen 

Zur Erkldrung der Zweibuchstaben-Codes und der anderen Ab- 
kiirzungen wird aufdie Erklarungen ("Guidance Notes on Co- 
des and Abbreviations ") am Anfang jeder regulciren Ausgabe der 
PCT-Gazette verwiesen. 



(57) Zusammenfassung: Verfahren zur gentechnischen Veranderung von Organismen der Gattang Blakeslea, entsprechende Or- 
ganismen und deren Verwendung Zusammenfassung Verfahren zur Herstellung eines gentechnisch veranderten Organismus der 
Gattang Blakeslea umfassend (1) Transformation mindestens einer der Zellen, (ii) ggf. Homokaryotisierung der aus (i) erhaltenen 
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Verfahren zur aentechnis chen Veranderung von Organismen der 
Gattung Blakeslea. entspreche nde Organismen und deren 
Verwendunq 

Die Erfindung betrifft ein Verfahren zur gentechnischen Veranderung von 
Organismen der Gattung Blakeslea, entsprechende Organismen und 
deren Verwendung. 

Pilze der Gattung Blakeslea sind als Produktionsorganismen bekannt. So 
wird z. B. Blakeslea trispora als Produktionsorganismus fur p-Carotin 
(Ciegler, 1965, Adv Appl Microbiol. 7:1) und Lycopin verwendet (EP 
1201762, EP 1184464, WO 03/038064). Daneben kommt Blakeslea zur 
Produktion anderer lipophiler Substanzen in Frage wie z.B. andere 
Carotinoide und deren Vorstufen, Phpspholipide, Triacylglyceride, 
Steroide, Wachse, fettlosliche Vitamine, Provitamine und Cofaktoren oder 
zur Produktion hydrophiler Substanzen wie z.B. EiweiUe, Aminosauren, 
Nukleotide und wasseriosliche Vitamine, Provitamine und Cofaktoren. 

Die hohen Produktivitaten fur p-Carotin und Lycopin machen Blakeslea, 
insbesondere Blakeslea trispora attraktiv fur die wirtschaftliche 
fermentative Herstellung von Carotinoiden und deren Vorstufen. 

Allerdings ist es auch von Interesse, die Produktivitaten der bisher 
naturltcherweise produzierten Carotine und deren Vorstufen weiter zu 
steigern und die Herstellung weiterer Carotinoide, wie z. B. Xanthophyile 
zu ermogiichen, die von Blakeslea bisher nicht oder nur in sehr geringem 
Mafte gebildet und isoliert werden konnen. 

Carotinoide ' werden Futtermitteln, Nahrungsmitteln, 

Nahrungserganzungsmitteln, Kosmetika und Arzneimitteln zugesetzt. Die 
Carotinoide dienen vor allem als Pigments zur Farbung. Daneben werden 
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die antioxidative Wirkung der Carotinoide und andere Eigenschaften 
dieser Substanzen genutzt. Man unterteilt die Carotinoide in die reinen 
Kohlenwasserstoffe, die Carotine und die sauerstoffhaltigen 
Kohlenwasserstoffe, die Xanthophylle. Xanthophylle wie Canthaxanthin 

5 und Astaxanthin werden beispielsweise zur Pigmentierung von 
HOhnereiern und Fischen eingesetzt (Britton et al. 1998, Carotinoids, Vol 
3, Biosynthesis and Metabolism). Die Carotine p-Carotin und Lycopin 
werden vor allem in der Humanernahrung eingesetzt. p-Carotin wird 
beispielsweise als Getrankefarbstoff verwendet. Lycopin hat eine 

10 krankheitsvorbeugende Wirkung (Argwal und Rao, 2000, CMAJ 163:739- 
744; Rao und Argwal 1999, Nutrition Research 19:305-323). Die farblose 
Carotinoidvorstufe Phytoen kommt vor allem fUr Anwendungen als 
Antioxidans in Frage. 

15 Der ilberwiegende Teil der Carotinoide und deren Vorstufen, die als 
Zusatzstoffe fur die oben genannten Anwendungen eingesetzt werden, 
wird durch chemische Synthese hergesteilt. Die chernische Synthese ist 
mehrstufig, technisch sehr aufwendig und verursacht hohe Herstelikosten. 
Fermentative Verfahren sind demgegenQber technisch verhaltnismafiig 

20 einfach und basieren auf kostengunstigen Einsatzstoffen. Fermentative 
Verfahren zur I lerstellung von Carotinoiden konnen dann wirtschaftfich 
attraktiv und wettbewerbsfahig zur chemischen Synthese sein, wenn die 
Produktivitat der bisherigen fermentativen Verfahren gesteigert wurde Oder 
neue Carotinoide auf Basis der bekannten Produktionsorganismen 

25 hergesteilt werden konnten. 

Ein Verfahren zur gentechnischen Veranderung von Blakeslea trispora ist 
erforderlich insbesondere, wenn Blakeslea zur Hersteliung von 
Xanthophylien genutzt werden soil, weii diese Verbindungen 
30 natOrlicherweise von Blakeslea nicht synthetisiert werden. 
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Von Blakeslea trispora sind bisher verschiedene DNA-Sequenzen bekannt 
insbesondere die DNA-Sequenz, die fur die Gene der 
Carotinoidbiosynthese von Geranylgeranylpyrophosphat bis p-Carotin 
codiert {WO 03/027293). 

5 

Allerdings slnd bisher kelne Methoden zur gentechnischen Veranderung 
von Blakeslea, insbesondere Blakeslea trispora bekannt 

Als Methode zur Herstellung von gentechnischen veranderten Pilzen 
10 wurde in einigen Fallen die Agrobacterium-vermittelte Transformation 
erfolgreich eingesetzt. So sind z. B. folgende Organismen durch 
Agrobakterien transformiert worden: Saccharomyces cerevisiae {Bundock 
et al., 1995, EMBO Journal, 14:3206-3214), Aspergillus awamori, 
Aspergillus nidulans, Aspergillus niger, Colletotrichum gloeosporioides, 
15 Fusarium solani pisi, Neurospora crassa, Trichoderrna reesei, Pleurotus 
ostreatus, Fusarium graminearum (van der Toorren et al., 1997, EP 
870835), Agraricus bisporus, Fusarium venenatum (de Groot et al., 1998, 
Nature Biotechnol. 16:839-842), Mycosphaereila graminicola (Zwiers et al. 
2001, Curr. Genet. 39:388-393), Glarea lozoyensis (Zhang et al., 2003, 
20 Mol. Gen. Genomics 268:645-655), Mucor miehei (Monfort et al. 2003, 
FEMS Microbiology Lett. 244:101 - 106). 

Von Interesse ist besonders eine homologe Rekombination, bei der 
zwsschen der einzufuhrenden DNA und der Zeil-DNA moglichst viele 
25 Sequenzhomologien bestehen, so dass eine ortsspezifische Einfuhrung 
bzw. Ausschaltung von genetischer Information im Genom des 
Empfangerorganismus moglich ist Andernfalls wird die Spender-DNA 
durch iliegitime bzw. nicht-homologe Rekombination ins Genom des 
Empfangerorganismus integriert, was nicht ortsspezifisch erfolgt 

30 
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Eine durch Agrobacierium vermittelte Transformation und anschiiefcende 
homologe Rckombination der transferierten DNA wurde bisher bei 
folgenden Organismen nachgewiesen: Aspergillus awamori (Gouka et a!. 
1999, Nature Biotech 17:598-601), Glarea lozoyensis (Zhang et a!., 2003, 
5 Mol. Gen. Genomics 268:645-655), Mycosphaerella graminicola (Zwiers et 
al. 2001, Curr, Genet. 39:388-393). 

Ais weitere Methode zur Transformation von Pilzen ist die Elektroporation 
bekannt. Die integrative Transformation von Hefe durch Elektroporation 
10 wurde von Hill, Nucl. Acids. Res. 17:8011 gezeigt. Fur filamentose Pilze 
wurde die Transformation durch Chakaborty und Kapoor beschrieben 
{1990, Nucl. Acids. Res. 18:6737). 

Eine „biolistische" Methode, d.h. die Obertragung von DNA durch 
15 Beschuss von Zellen mit DNA-beladenen Partikeln wurde beispielsweise 
fQr Trichoderma harzianum und Gliocladium virens beschrieben (Lorito et 
al. 1993, Curr. Genet. 24:349-356). 

Diese Methoden konnten bisher jedoch nicht erfoigreich zur gezielten 
20 genetischen Veranderung von Biakeslea und insbesondere Blakeslea 
trispora eingesetzt werden. 

Eine besondere Schwierigkeit bei der Hersteilung von gezielt genetisch 
veranderten Blakeslea und Blakeslea trispora ist die Tatsache, dass deren 

25 Zeilen in alien Stadien des sexuelien und des vegetativen Zellzyklus 
mehrkernig sind. In Sporen von Blakeslea trispora Stamm NRRL2456 und 
NRRL2457 wurden z. B. im Durchschnitt 4,5 Kerne pro Spore 
nachgewiesen (Metha und Cerda-Olmedo, 1995, Appi. . Microbiol. 
Biotechnol. 42:836-838). Dies hat zur Folge, dass die gentechnische 

30 Veranderung in aller Regel nur in einem oder wenigen Kernen vorliegt, die 
Zeilen also heterokaryotisch sind. 
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Sollen die genetisch veranderten Blakeslea-Arten, insbesondere 
Blakeslea trispora zur Produktion eingesetzt werden, so ist es 
insbesondere bei einer Gendeietion wichtig, dass in den 
5 Produktionsstammen die gentechnische Veranderung in alien Kernen 
vorliegt, 30 dass eine stabile und hohe Syntheseleistung ohne 
Nebenprodukte moglich wird. Die Stamme mussen folglich in Bezug auf 
die gentechnische Veranderung homokaryotisch sein. 

10 Lediglich fur Phycomyces blakesleeanus ist ein Verfahren beschrieben 
worden, urn homokaryotische Zellen zu erzeugen (Roncero et al., 1984, 
Mutat. Res. 125:195). Durch Zugabe des mutagenen Agens MNNG (N- 
Methy!-N'-nitro-N-nitrosoguanidin) werden nach dem dort beschriebenen 
Verfahren Kerne in den Zellen eliminiert, so dass statistisch eine gewisse 

15 Anzahl von Zellen mit nur noch einem funktionellem Kern vorliegt. Die 
Zellen werden dann einer Selektion unterzogen, in der nur einkernige 
Zellen mit einem rezessiven Selektionsmarker zu einem Mycel 
auswachsen konnen. Die Nachkommen dieser selektierten Zellen sind 
mehrkernig und homokaryotisch. Ein rezessiver Selektionsmarker fur 

20 Phycomyces blakesieanus ist z. B. dar. Dar + -Stamme nehmen das 
toxische Ribofiavin-Analog 5-Carbon-5-deazariboflavin auf; Dar~-Stamme 
dagegen nicht (Delbruck et al. 1979, Genetics 92:27). Die Selektion von 
rezessiven Mutanten erfolgt durch Zugabe von 5-Carbon-5-deazariboflavin 
(DARF). 

25 

Allerdings ist dieses Verfahren nicht fur Blakeslea, insbesondere 
Blakeslea trispora bekannt und insbesondere nicht mit im Zusammenhang 
mit einer Transformation beschrieben worden. 

30 Aufgabe der voriiegenden Erfindung ist es, ein Verfahren bereitzusteiien, 
mit dem eine gentechnische Veranderung von Biakeslea-Stammen, 
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insbesondere Blakeslea trispora moglich ist. DarQber hinaus ist es 
Aufgabe der Erfindung ern Verfahren bereitzustellen, das die Hersteliung 
homokaryotischer genetisch veranderter Stamme erlaubt, Ferner ist es 
eine Aufgabe der Erfindung entsprechend gentechnisch veranderte Zellen 
5 bereitzustellen. 

Diese Aufgabe wird durch ein Verfahren zur Hersteliung eines 
gentechnisch veranderten Organismus der Gattung Blakeslea gelost, 
umfassend 

10 (i) Transformation mindestens einer der Zellen, 

(ii) ggf. Homokaryotisierung der aus (i) erhaltenen Zellen, so dass 
Zellen entsteben, in denen die Kerne in einem oder in mehreren 
genetischen Merkrnalen alle gleichartig verandert sind und diese 
genettsche Veranderung zur Auspragung bringen, und 

15 (iii) Selektion der gentechnisch veranderten Zelle oder Zellen. 

Mit der erfindungsgema&en Methode ist es moglich, mehrkernige Zellen 
der Pilze Blakeslea gezielt und stabil genetisch zu verandern, urn so Mycei 
aus Zellen mit einheitlichen Kernen zu gewlnnen. Vorzugswelse handelt 
20 es sich Zellen von Pilzen der Art Blakeslea trispora. 

Unter Transformation wird die Obertragung einer genetischen Information 
in den Organismus, insbesondere Piiz verstanden. Darunter solien alle 
dem Fachmann bekannten Moglichkeiten zur Einschleusung der 
25 Information, insbesondere DNA fallen, z. B. Beschuss mit DNA-beladenen 
Partikeln, Transformation mittels Protopiasten, Mikroinjektion von DNA, 
Eiektroporation, Konjugation oder Transformation kompetenter Zellen, 
Chemikalien oder Agrobakterien vermittelte Transformation. Als 
genetische Information werden ein Genabschnitt, ein Gen oder mehrere 
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Gene verstanden. Die genetische information kann z. B. mit Hilfe eines 
Vectors oder als freie Nukleinsaure (z. B. DNA, RNA) und auf sonstige 
Weise in die Zellen eingebracht und entweder durch Rekombination ins 
Wirtsgenom eingebaut oder in freier Form in der Zelle vorliegen. 
5 Besonders bevorzugt ist hierbei die homologe Rekombination. 

Bevorzugte Transformationsmethode ist die Agrobacterium tumefaciens- 
vermittelte Transformation. Hierzu wird zunachst die zu transferierende 
Spender-DNA in einen Vektor eingefQgt, der (i) fiankierend zu der zu 

10 transferierenden DNA die T-DNA-Enden tragt, der (ii) einen 
Selektionsmarker enthait und der (iii) ggf. Promotoren und Terminatoren 
fur die Genexpression der Spender-DNA aufweist Dieser Vektor wird in 
einen Agrobacterium-tumefaciens-Stamm Qbertragen, der ein Ti-Plasmid 
mit den vir-Genen enthait. vir-Gene sind fQr den DNA-Transfer in 

15 Biakeslea verantwortlich. Mit diesem Zwei-Vektor-System wird die DNA 
von Agrobacterium in Blakesiea Obertragen. Hierzu werden- die 
Agrobakterien zunachst in Gegenwart von Acetosyringone inkubiert. 
Acetosyringone induziert die vir-Gene. AnschliefJend werden Sporen von 
Blakesiea trispora zusammen mit den induzierten Zellen von 

20 Agrobacterium tumefaciens auf Acetosyringone-haltigem Medium inkubiert 
und dann auf Medium ubertragen, das eine Selektion der Transformanten, 
d.h. der gentechnisch veranderten Stamme von Biakeslea ermoglicht. 

Der Begriff Vector wird in der vorliegenden Anmeldung ais eine 
25 Bezeichnung fQr ein DNA-Molekul verwendet, das zum Einschleusen und 
ggf. zur Vermehrung von Fremd-DNA in eine Zelie dient (siehe auch 
"Vector" in Rompp Lexikon Chemie - CDROM Version 2.0, Stuttgart/New 
York: Georg Thieme Verlag 1999). in der vorliegenden Anmeldung sollen 
unter dem Begriff "Vector" Plasmide, Cosmide usw. verstanden werden, 
30 " die diesem Zweck dienen. 
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Unter Expression wird in der voriiegenden Anmeidung die Obertragung 
einer genetischen Information ausgehend von DNA oder RNA in ein Gen- 
Produkt (hier vorzugsweise Carotinoide) verstanden und soil auch den 
Begriff der Oberexpression beinhalten, worrtit eine verstarkte Expression 
5 gemeint ist, so dass ein bereits in der nicht transformierten Zelle (Wiidtyp) 
hergestclltes Produkt veretarkt produziert wird oder einen grollen Teii des 
gesamten Gehaites der Zelle ausmacht. 

Unter gentechnischer Veranderung soil die Einschleusung genetischer 
10 Information in einen Empfangerorganismus, so dass diese stabil exprimiert 
und bei der Zellteilung weitergegeben wird, verstanden werden. Danach 
wird gegebenenfalls die Homokaryontisierung durchgefuhrt, d.h. die 
Herstellung von Zellen, die nur einheitliche Kerne enthalten, d. h. Kerne 
mit gieichem genetischem Informationsgehalt. 

15 

Diese Homokaryotisierung ist insbesondere notwendig, wenn die durch 
Transformation eingefuhrte genetische Information rezessiv vorliegt, d. h. 
nicht zur Auspragung gelangt. Fuhrt die Transformation aber zu einem 
dominanten Voriiegen der genetischen Information, d. h. wird sie 
20 ausgepragt, so ist eine Homokaryotisierung nicht unbedingt n6tig. 

Vorzugsweise wird zur Homokaryotisierung eine Selektion der einkernigen 
Sporen durchgefuhrt. Von Natur aus ist ein geringer Anteil der Sporen von 
Biakeslea trispora einkernig, so dass sich diese ggf. nach speztfischer 
25 Markierung z. B. Farbung der Zellkerne aussortieren lassen. Dies wird 
bevorzugterweise mitteis FACS (Fluorescence Activated Cell Sorting) 
anhand der geringeren Fluoreszenz der einkernigen Zeilen durchgefuhrt. 

AlternatIV kann zur Homokaryotisierung ixinachst eine Kernreduktion 
30 durchgefuhrt werden. Hierzu kann ein mutagenes Agens eingesetzt 
werden, wobei es sich insbesondere urn N-Methyl-N'-nitrOrnitrosoguanidin 
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(MNNG) handelt. Auch die Verwendung von energiereichen Sirahlen, wie 
UV- oder Rontgen-Strahlen zur Kemreduktion ist moglich. Anschliefcend 
kann zur Seiektion auf das FACS Verfahren oder rezessive 
Selektionsmarker zuruckgegiiffen werden. 

5 

Unter SeSektlon wird die Auswahl von Zellen verstanden, deren Kerne 
dieselbe genetische Information beinhaiten, d. h. Zellen die die gleichen 
Eigenschaften aufweisen, wie Resistenzen oder die Hersteliung bzw. 
vermehrte Hersteliung eines Produktes. In der Seiektion werden neben 
10 der FACS Methode bevorzugt 5-Carbon-5-deazariboflavin (darf) und 
Hygromycin (hyg) oder 5'-Fluororotat (FOA) und Uracil eingesetzt. 

Der in der Transformation (i) eingesetzte Vector kann derail gestaltet sein, 
dass die im Vector enthaltene genetische Information in das Genom 
15 mindestens einer Zelle integriert wird. Dabei kann genetische Information 
in der Zelle ausgeschaltet werden. 

Der in der Transformation (i) eingesetzte Vector kann aber auch derart 
ausgestaitet sein, dass die im Vector enthaltene genetische Information in 
20 der Zeiie exprimiert wird, d. h. genetische Information eingefiigt wird, die 
im korrespondierenden Wiidtyp nicht vorhanden ist oder die durch die 
Transformation verstarkt bzw. uberexprimiert wird. 

Der Vector kann beliebige genetische informationen zur genetischen 
25 Veranderungen von Organismen der Gallung Blakeslea enthalten. 

Unter „genetischer Information" werden vorzugsweise Nukleinsauren 
verstanden, deren Einbringung in den Organismus der Gattung Blakeslea 
zu einer genetischen Veranderung in Organismen der Gattung Biakesiea, 
30 also beispieisweise zu einer Verursachung, Erhohung oder Reduzierung 
von Enzymaktivitaten im Vergleich zum Ausgangsorganismus fuhren. 
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Der Vector kann beispielsweise genetische Information zur Herstellung 
iipophiler Substanzen enthalten wie z.B. Carotinoide und deren Vorstufen, 
Phospholipide, Triacylglyceride, Steroide, Wachse, fettlosliche Vitamine, 
5 Proyitamine und Cofaktoren oder genetische Information zur Herstellung 
hydrophiler Substanzen wie z.B. Elweilie, Aminosauren, Nukleotide und 
wasserlosfiche Vitaminen, Provitamine und Cofaktoren. 

Bevorzugterweise enthalt der eingesetzte Vector genetische Informationen 
10 zur Herstellung von Carotinoiden oder Xanthophyllen oder deren 
Vorstufen. 

Bevorzugterweise enthalt der Vektor genetische Information, die eine 
Lokalisierung der Carotinoidbiosynthese-Enzyme in dem Zellkompartiment 
15 bewirki in dem die Carotinotdbiosynthese stattfindet. 

Besonders bevorzugt sind genetische Informationen zur Herstellung von 
Astaxanthin, Zeaxanthin, Echinenon, (3-Cryptoxanthin, Andonixanthin, 
Adonirubin, Canthaxanthin, 3- und 3'-Hydroxyechinenon, Lycopin, Lutein, 
20 p-Carotin, Phytoen oder Phytofluen. Ganz besonders bevorzugt sind 
genetische Informationen zur Herstellung von Phytoen, Bixin, Lycopin, 
Zeaxanthin, Canthaxanthin und Astaxanthin. 

Entsprechend werden in einer bevorzugten Variante der Erfindung 
25 Organlsmen hergestellt und kultlvlert, die uber elne erhOhte Syntheserate 
fQr Zwischenprodukte der Carotinoidbiosynthese verfOgen und folglich 
eine erhohte Produktivitat fur Endprodukte der Carotinoidbiosynthese 
aufweisen. Zur Erhohung der Syntheserate fQr Zwischenprodukte der 
Carotinoidbiosynthese werden insbesondere die Aktivit&ten der Enzyme 3- 
30 Hydroxy-3-Methyl-Glutaryl-Coenzym-A-Reduktase, 
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Isopentenylpyrophosphat-lsomerase und Geranyipyrophosphatsynthase 
gesteigert. 

Entsprechend werden in einer besonders bevorzugten Variante der 
5 Erfindung Organismen hergestellt und kultiviert, die gegenUber dem 
Wiidtyp eine erhohte HMG-CoA-Reduktase-Aktivitat aufweisen. 

Unter HMG-CoA-Reduktase-Aktivitat wird die EnzymaktivitSt einer HMG- 
CoA-Reduktase {3-Hydroxy-3-Methyi-Glutaryl-Coenzym-A~Reduktase) 
10 verstanden. 

Unter einer HMG-CoA-Reduktase wird ein Protein verstanden, das 
die enzymatische Aktivitat aufweist, 3~Hydroxy-3-Methyi-Glutaryl- 
Coenzym-A in Mevaionat umzuwandeln. 

15 Dementsprechend wird unter HMG-CoA-Reduktase-Aktivitat die in einer 
bestimmten Zeit durch das Protein HMG-CoA-Reduktase umgesetzte 
Menge 3»Hydroxy-3-Methyl-Glutaryl-Coenzym-A bzw. geblldete Menge 
Mevaionat verstanden. 

20 Bei einer erhohten HMG-CoA-Reduktase-Aktivitat gegenQber dem Wiidtyp 
wird somit im Vergleich zum Wiidtyp in einer bestimmten Zeit durch das 
Protein HMG-CoA-Reduktase die umgesetzte Menge 3-Hydroxy-3-Methyl- 
Glutaryl-Coenzym-A bzw. die gebildete Menge Mevaionat erhdht. 

25 Vorzugsweise betragt diese Erhohung der HMG-CoA-Redukta3e-Aktivitat 
mindestens 5%, weiter bevorzugt mindestens 20%, weiter bevorzugt 
mindestens 50%, weiter bevorzugt mindestens 100%, bevorzugter 
mindestens 300%, noch bevorzugter mindestens 500%, insbesondere 
mindestens 600% der HMG-CoA-Reduktase-Aktivitat des Wildtyps. 

30 
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In einer bevorzugten Ausfuhrungsform erfolgt die Erhohung der HMG- 
CoA-Reduktase-Aktivitat gegenQber dem Wildtyp durch eine Erhohung der 
Genexpression einer Nukleinsaure codierend eine HMG-CoA-Reduktase. 

5 In einer besonders bevorzugten Ausfuhrungsform des erfindungsgemaRen 
Verfahrens erfolgt die Erhohung der Genexpression einer Nukleinsaure 
codierend eine HMG-CoA-Reduktase indem man ein 
Nukleinsaurekonstrukt, enthaltend eine Nukleinsaure codierend eine 
HMG-CoA-Reduktase in den Organismus einbringt, deren Expression in 

10 dem Organismus, verglichen mlt dem Wildtyp, einer reduzierten 
Regulation unterliegt. 

Unter einer reduzierten Regulation verglichen mit dem Wildtyp, wird eine 
im Vergleich zum vorstehend definierten Wildtyp verringerte, vorzugsweise 
15 keine Regulation auf Expressions- oder Proteinebene verstanden. 

Die reduzierte Regulation kann vorzugsweise durch einen im 
Nukleinsaurekonstrukt mit der kodierenden Sequenz funktionell 
verknQpften Promotor erreicht werden, der in dem Organismus verglichen 
20 mit dem Wildtyp-Promoter einer reduzierten Regulation unterliegt. 

Berspielsweise unterliegen die Promotoren ptefl aus Blakeslea trispora 
und pgpdA aus Aspergillus nidulans nur einer reduzierten Regulation und 
slnd daher insbesondere als Promotoren bevorzugt. 

25 

Diese Promotoren zeigen eine annahemd konstitutive Expression in 
Blakeslea trispora, so dass die transkriptionelle Regulation nicht mehr 
uber die intermediate der Carotinoidbiosynthese ablauft. 

30 Die reduzierte Regulation kann in einer weiteren bevorzugten 
Ausfuhrungsform dadurch erreicht werden, dass man als Nukleinsaure 



WO 2004/063358 



PCT/EP2004/000100 



13 

codierend eine HMG-CoA-Reduktase eine Nukleinsaure verwendet, deren 
Expression in dem Organismus, verglichen mit der Organismus eigenen, 
orthologen Nukleinsaure, einer reduzierten Regulation unteriiegt. 

5 Besonders bevorzugt ist die Verwendung einer Nukleinsaure, die nur den 
katalytischen Bereich der I IMG-CoA-Reduktase kodiert (trunkierte (t- 
)HMG-CoA-Reduktase). Die fur die Regulation verantwortliche Membran- 
Domane fehlt. Die verwendete Nukleinsaure unteriiegt somtt einer 
reduzierten Regulation und fuhrt zu einer Erhohung der Genexpression 
10 der HMG-CoA-Reduktase. 
In einer besonders bevorzugten Ausfuhrungsform bringt man 
Nukleinsauren in Blakeslea trispora ein, welche die Sequenz SEQ ID. NO. 
75 enthalten. 

15 Weitere Beispiele fCir HMG-CoA-Reduktasen und damit auch fur die auf 
den katalytischen Bereich reduzierten t-HMG-CoA-Reduktasen bzw. die 
kodierenden Gene lassen sich beispielsweise aus verschiedenen 
Organismen, deren genomische Sequenz bekannt ist, durch 
Homologievergleiche der Sequenzen aus Datenbanken mit der SEQ ID. 

20 NO. 75 leicht auffinden. 

Weitere Beispiele fur HMG-CoA-Reduktasen und damit auch fCir die auf 
den katalytischen Bereich reduzierten t-HMG-CoA-Reduktasen bzw. die 
kodierenden Gene lassen sich weiterhin beispielsweise ausgehend von 
25 der Sequenz SEQ ID. NO. 75 aus verschiedenen Organismen deren 
genomische Sequenz nicht bekannt ist, durch Hybridisierungs- und PCR- 
Techniken in an sich bekannter Weise leicht auffinden. 

in einer besonders bevorzugten AusfQhrungsform wird die reduzierte 
30 Regulation dadurch erreicht, dass man als Nukleinsaure codierend eine 
HMG-CoA-Reduktase eine Nukleinsaure verwendet, deren Expression in 
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dem Organismus, verglichen mit der Organismus eigenen, orthologen 
Nukleinsaure, einer reduzierten Regulation unterliegt und einen Promotor 
verwendet, der in dem Organismus, verglichen mit dem Wildtyp-Promoter 
einer reduzierten Regulation unteriiegt 

5 

Entsprechend wird in einer bevorzugten Variante der Erfindung durch die 
Transformation die Genexpression der Phytoendesaturase ausgeschaltet, 
so dass das von den Organismen produzierte Phytoen gewonnen werden 
kann. Der in der Transformation (i) eingesetzte Vector umfasst daher in 
10 einer Ausfiihrungsform der Erfindung bevorzugterweise eine Sequenz 
codierend fur ein Fragment des Gens der Phytoendesaturase, 
insbesondere carB aus Blakesiea trispora mit der SEQ ID NO: 69. 

Entsprechend wird in einer bevorzugten Variante der Erfindung durch 
15 Transformation die Genexpression der Lycopincyclase ausgeschaltet, so 
dass das von den Organismen produzierte Lycopin gewonnen werden 
kann. Der in der Transformation eingesetzte Vektor umfasst daher in einer 
Ausfiihrungsform der Erfindung bevorzugterweise eine Sequenz 
codierend fur ein Fragment des Gens der Lycopincyclase, insbesondere 
20 carR aus Blakesiea trispora s. (WO 03/027293). 

In einer weitereh bevorzugten Ausfuhrungsform werden die Organismen 
der Gattung Blakesiea beispielsweise in die Lage versetzt Xanthophylie, 
wie beispielsweise Zeaxanthin oder Astaxanthin herzustellen, indem die 
25 genetisch veranderten Organismen der Gattung Blakesiea im Vergleich 
zum Wiidtyp eine Hydroxyiase-Aktivitat und/oder eine Ketolase-AktivitSt 
besitzen. 

Der in der Transformation (i) eingesetzte Vector enthalt also in einer 
30 weiteren, bevorzugten Variante der Erfindung genetische Informationen, 
die nach Expression eine Ketolase- und/oder Hydroxyiase-Aktivitat 
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entfalten, so dass die Organismen Zeaxanthin Oder Astaxanthin 
produzieren. 

Unter Ketoiase-Aktivitat wird die Enzymaktivitat einer Ketolase 
5 verstanden. 

Unter einer Ketolase wird ein Protein verstanden, das die enzymatische 
Aktivitat aufweist, am, gegebenenfalis substituierten, p-lonon-Ring von 
Carotinoiden eine Keto-Gruppe einzufuhren. 

w 

Insbesondere wird unter einer Ketolase ein Protein verstanden, das 
die enzymatische Aktivitat aufweist, p-Carotin in Canthaxanthin 
umzuwandeln. 

15 Dementsprechend wird unter Ketoiase-Aktivitat die in einer bestimmten 
Zeit durch das Protein Ketolase umgesetzte Menge p-Carotin bzw. 
gebiidete Menge Canthaxanthin verstanden. 

Unter dem Begriff "Wildtyp" wird erfindungsgemafc der entsprechende 
20 nicht genetisch veranderte Ausgangsorganismus der Gattung Blakesleaa 
verstanden. 

Je nach Zusammenhang kann unter dem Begriff "Organismus" der 
Ausgangsorganismus (Wildtyp) der Gattung Blakesleaa oder ein 
25 erfindungsgemaRer, genetisch veranderter Organismus der Gattung 
Blakesleaa oder beides verstanden werden. 

Vorzugsweise wird unter "Wildtyp" fur die Verursachung der Ketoiase- 
Aktivitat und fur die Verursachung der Hydroxylase-Aktivitat jeweils ein 
30 Referenzorganismus verstanden. 
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Dieser Referenzorganismus der Gattung Biakeslea ist Blakeslea trispora 
ATCC 14271 Oder ATCC 14272, die sich iediglich im Paarungstyp 
unterscheiden, 

5 Die Besiimmung der Ketolase-Aktivitat in erfindungsgemaften genetisch 
veranderten Organismen der Gattung Blakesleaa und in Wildtyp- bzw. 
Referenzorganismen erfoigt vorzugsweise unter folgenden Bedingungen: 

Die Besttmmung der Ketolase-Aktivitat in Organismen der Gattung 
10 Biakeslea erfoigt in Anlehnung an die Methode von Fraser et al., (J. Biol. 
Chem. 272(10): 6128-6135, 1997). Die Ketolase-Aktivitat in Extrakten wird 
mit den Substraten beta-Carotin und Canthaxanthin in Gegenwart von 
Lipid (Sojalecithin) und Detergens (Natriumcholat) bestimmt. 
Substrat/Produkt-Verhaltnisse aus den Ketolase-Assays werden mittels 
15 HPLC ermittelt. 

Der erfindungsgemafce genetisch veranderte Organismus der Gattung 
Blakesleaa weist in dieser, bevorzugten AusfOhrungsform im Vergleich 
zum genetisch nicht veranderten Wildtyp eine Ketolase-Aktivitat auf und ist 
20 somit vorzugsweise in der Lage, transgen eine Ketolase zu exprimieren. 

in einer weiter bevorzugten AusfOhrungsform erfoigt die Verursachung der 
Ketolase-Aktivitat in den Organismen der Gattung Biakesleaa durch 
Genexpression einer Nukleinsaure kodierend eine Ketolase. 

25 

In dieser bevorzugten AusfOhrungsform erfoigt die Verursachung der 
Genexpression einer Nukleinsaure kodierend eine Ketolase vorzugsweise 
durch Snbringen von Nukieinsauren, die Ketolasen kodieren in die 
Ausgangsorganismus der Gattung Blakesleaa. 

30 
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Dazu kann prinzipieil jedes Ketolase-Gen, also jede Nukleinsauren die 
eine Ketolase codiert verwendet werden. 

Aile in der Beschreibung erwahnten Nukleinsauren konnen beispielsweise 
5 eine RNA-, DMA- oder cDNA-Sequenz sein. 

Bei genomischen Ketolase-Sequenzen aus eukaryontischen Quelien, die 
Introns enthalten, sind fDr den Fall das der Wirtsorganismus der Gattung 
Biakesieaa nicht in der Lage ist oder nicht in die Lage versetzt werden 
10 kann, die entsprechenden Ketolase zu exprimieren, bevorzugt bereits 
prozessierte Nukleinsauresequenzen, wie die entsprechenden cDNAs zu 
verwenden. 

Beispiele fur Nukleinsauren, kodierend eine Ketolase und die 
15 entsprechenden Ketolasen, die im erfindungsgemaiien Verfahren 
verwendet werden konnen sind beispielsweise Sequenzen aus: 

Haematoccus pluvialis, insbesondere aus Haematoccus pluviaiis Fiotow 
em. Wiile (Accession NO: X86782; Nukleinsaure: SEQ ID NO: 11, Protein 
20 SEQ ID NO: 12), 

Haematoccus pluvialis, NIES-144 (Accession NO: D45881; Nukleinsaure: 
SEQ ID NO: 13, Protein SEQ ID NO: 14), 

25 Agrobacterium aurantiacum (Accession NO: D58420; Nukleinsaure: SEQ 
ID NO: 15, Protein SEQ ID NO: 16), 

Aiicaligenes spec. (Accession NO: D58422; Nukieinsaure: SEQ ID NO: 17, 
Protein SEQ ID NO: 18), 

30 
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Paracoccus marcusii (Accession NO: Y15112; Nukleinsaure: SEQ ID NO: 
19, Protein SEQ ID NO: 20), 

Synechocystis sp. Strain PC6803 (Accession NO: NP442491; 
5 Nukleinsaure: SEQ ID NO: 21, Protein SEQ ID NO: 22), 

Bradyrhizobium sp. (Accession NO: AF218415; Nukleinsaure: SEQ ID NO: 
23, Protein SEQ ID NO: 24), 

10 Nostoc sp. Strain PCC7120 (Accession NO: AP003592, BAB74888; 
Nukleinsaure: SEQ ID NO: 25, Protein SEQ ID NO: 26), 

Nostoc punctiforme ATTC 29133, Nukleinsaure: Acc.-No. 
NZ_AABC01000195, Basenpaar 55,604 bis 55,392 (SEQ ID NO: 27); 
15 Protein: Acc.-No. ZP_00111258 (SEQ !D NO: 28) (als putatives Protein 
annotiert) oder 

Nostoc punctiforme ATTC 29133, Nukleinsaure: Acc.-No. 
NZ_AABC01000196, Basenpaar 140,571 bis 139,810 (SEQ ID NO: 29), 
20 Protein: (SEQ ID NO: 30) (nicht annotiert). 

Weitere natQrliche Beispiele fur Ketolasen und Ketolase-Gene, die im 
erfindungsgema&en Verfahren verwendet werden konnen, fassen sich 
beispielsweise aus verschiedenen Organismen, deren genomische 
25 Sequent bekannt ist, durch Identitatsvergleiche der 
Aminosauresequenzen oder der entsprechenden ruckiibersetzten 
Nukleinsauresequenzen aus Datenbanken mit den vorstehend 
beschriebenen Sequenzen und insbesondere mit den Sequenzen 
SEQ ID NO: 12 und/oder 26 und/oder 30 leicht auffinden. 

30 
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Weitere natiirliche Beispiele fur Ketolasen und Ketolase-Gene [assen sich 
weiterhin ausgehend von den vorstehend beschriebenen 
Nukleinsauresequenzen, insbesondere ausgehend von den Sequenzen 
SEQ ID NO; 12 und/oder 26 und/oder 30 aus verschiedenen Organismen, 
5 deren genomische Sequenz nicht bekannt ist, durch 
Hybridisierungstechnikcn in an sich bekannter Weise ieicht auffinden. 

Die Hybridisierung kann unter moderaten (geringe Stringenz) Oder 
vorzugsweise unter stringenten (hohe Stringenz) Bedingungen erfolgen. 

10 

Solche Hybridisierungsbedingungen sind beispielsweise bei Sambrook, J., 
Fritsch, E.F., Maniatis, T., in: Molecular Cloning (A Laboratory Manual), 2. 
Auflage, Cold Spring Harbor Laboratory Press, 1989, Seiten 9.31-9.57 
oder in Current Protocols in Molecular Biology, John Wiley & Sons, N.Y. 
15 (1989), 6.3.1-6.3.6 beschrieben. 

Beispielhaft konnen die Bedingungen wahrend des Waschschrittes 
ausgewahlt sein aus dem Bereich von Bedingungen begrenzt von solchen 
mit geringer Stringenz (mit 2X SSC bei 50°C) und solchen mit hoher 
20 Stringenz (mit 0,2X SSC bei 50°C, bevorzugt bei 65°C) (20X SSC: 0,3 M 
Natriumcitrat, 3 M Natriumchlorid, pH 7.0). 

Daruberhinaus kann die Temperatur wahrend des Waschschrittes von 
moderaten Bedingungen bei Raumtemperatur, 22°C, bis zu stringenten 
25 Bedingungen bei 65°C angehoben werden. 

Beide Parameter, Salzkonzentration und Temperatur, konnen gleichzeitig 
variiert werden, auch kann einer der beiden Parameter konstant gehalten 
und nur der andere variiert werden. Wahrend der Hybridisierung konnen 
30 auch denaturierende Agenzten wie zum Beispiel Formamid Oder SDS 



WO 2004/063358 



PCT/EP2OO4/O00100 



20 



eingesetzt werden. fn Gegenwart von 50 % Formamid wird die 
Hybridisierung bevorzugt bei 42°C ausgefuhrt 

Einige beispielhafte Bedingungen fur Hybridisierung und Waschschritt sind 
5 infolge gegeben: 



(1) Hybridiserungsbedingungen mit zum Beispiel 

(i) 4X SSC bei 65°C, oder 

(ii) 6X SSC bei 45°C, oder 

10 (iii) 6X SSC bei 68°C, 100 mg/ml denaturierter Fischsperma-DNA, oder 

(iv) 6X SSC, 0,5 % SDS, 100 mg/mi denaturierte, fragmentierte 
Lachssperma-DNA bei 68°C, oder 

(v) 6XSSC, 0,5 % SDS, 100 mg/ml denaturierte, fragmentierte 
Lachssperma-DNA, 50 % Formamid bei 42°C, oder 

15 (vi) 50 % Formamid, 4X SSC bei 42°C, oder 

(vii) 50 % (vol/vol) Formamid, 0,1 % Rinderserumalbumin, 0,1 % Ficoll, 
0.1 % Polyvinytpyrrolidon, 50 mM Natriumphosphatpuffer pH 6,5, 
750 mM NaCI, 75 mM Natriumcitrat bei 42°C, oder 

(viii) 2X oder 4X SSC bei 50°C (moderate Bedingungen), oder 

20 (ix) 30 bis 40 % Formamid, 2X oder 4X SSC bei 42°C (moderate 
Bedingungen). 



(2) Waschschritte fiir jeweils 10 Minuten mit zum Beispiel 

(i) 0,015 M NaCI/0,0015 M Natriumcitrat/0,1 % SDS bei 50°C, oder 

25 (ii) 0,1X SSC bei 65"C, oder 

(iii) 0.1X SSC, 0,5 % SDS bei 68°C, oder 

(iv) 0.1X SSC, 0,5 % SDS, 50 % Formamid bei 42°C, oder 

(v) 0,2X SSC, 0,1 % SDS bei 42°C, oder 

(vi) 2X SSC bei 65°C (moderate Bedingungen). 
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In einer bevorzugten Ausfuhrungsform der erfmdungsgema&en genetisch 
veranderten Organismen der Gattung Blakeslea bringt man Nukleinsauren 
ein, die ein Protein kodieren, enthaltend die Aminosauresequenz SEQ ID 
NO: 12 Oder eine von dieser Sequenz durch Substitution, Insertion oder 

5 Deletion von Aminosauren abgeieitete Sequenz, die eine Identitat von 
mindestens 20 %, vorzugsweise mindestens 30 %, bevorzugter 
mindestens 40 %, bevorzugter mindestens 50 %, bevorzugter mindestens 
60%, bevorzugter mindestens 70%, bevorzugter mindestens 80%, 
besonders bevorzugt mindestens 90%, insbesondere 91%, 92%, 93%, 

10 94%, 95%, 96%, 97%, 98%, 99% auf Aminosaureebene mit der Sequenz 
z SEQ ID NO: 12 und die enzymatische Eigenschaft einer Ketolase 
aufweist. 

Dabei kann es sich urn eine natCirliche Ketoiase-Sequenz handeln, die wie 
16 vorstehend beschrieben durch Identitatsvergleich der Sequenzen aus 
anderen Organismen gefunden werden kann oder urn eine kOnstliche 
Ketoiase-Sequenz die ausgehend von der Sequenz SEQ ID NO: 12 durch 
kunstliche Variation, beispielsweise durch Substitution, Insertion oder 
Deletion von Aminosauren abgewandelt wurde. 

20 

In einer weiteren, bevorzugten Ausfuhrungsform der erfindungsgemalien 
Verfahren bringt man Nukleinsauren ein die ein Protein kodieren, 
enthaltend die Aminosauresequenz SEQ ID NO: 26 oder eine von dieser 
Sequenz durch Substitution, Insertion oder Deletion von Aminosauren 

25 abgeieitete Sequenz, die eine Identitat von mindestens 20 %, 
vorzugsweise mindestens 30%, bevorzugter mindestens 40%, 
bevorzugter mindestens 50 %, bevorzugter mindestens 60 %, bevorzugter 
mindestens 70 %, bevorzugter mindestens 80 %, besonders bevorzugt 
mindestens 90 % insbesondere 91%, 92%, 93%, 94%, 95%, 96%, 97%, 

30 98%, 99% auf Aminosaureebene m'rt der Sequenz SEQ ID NO: 26 und die 
enzymatische Eigenschaft einer Ketolase aufweist. 



WO 2004/063358 



PCT/EP2004/000100 



22 

Dabei kann es sich um eine naturliche Ketolase-Sequenz handeln, die, 
wie vorstehend beschrieben, durch Identitatsvergleich der Sequenzen aus 
anderen Organismen gefunden werden kann oder um eine kOnstiiche 
5 Ketolase-Sequenz die ausgehend von der Sequenz SEQ ID NO: 26 durch 
kOnstiiche Variation, beispielsweise durch Substitution, insertion oder 
Deletion von Aminosauren abgewandelt wurde. 

in einer weiteren, bevorzugten Ausfuhrungsform der erfindungsgema&en 
10 Verfahren bringt man Nukleinsauren ein die ein Protein kodieren, 
enthaltend die Aminosauresequenz SEQ ID NO: 30 oder eine von dieser 
Sequenz durch Substitution, Insertion oder Deletion von Aminosauren 
abgeleitete Sequenz, die eine Identitat von mindestens 20 %, 
vorzugsweise mindestens 30%, bevorzugter mindestens 40%, 
15 bevorzugter mindestens 50 %, bevorzugter mindestens 60 %, bevorzugter 
mindestens 70 %, bevorzugter mindestens 80 %, besonders bevorzugt 
mindestens 90 %, insbesondere 91%, 92%, 93%, 94%, 95%, 96%, 97%, 
98%, 99% auf Aminosaureebene mit der Sequenz SEQ ID NO: 30 und die 
enzymatische Eigenschaft einer Ketolase aufweist. 

20 

Dabei kann es sich um eine naturliche Ketolase-Sequenz handeln, die, 
wie vorstehend beschrieben, durch Identitatsvergleich der Sequenzen aus 
anderen Organismen gefunden werden kann oder um eine kOnstiiche 
Ketolase-Sequenz die ausgehend von der Sequenz SEQ ID NO: 30 durch 
25 kOnstiiche Variation, beispielsweise durch Substitution, Insertion oder 
Deletion von Aminosauren abgewandelt wurde. 

Unter dem Begriff "Substitution" ist in der Beschreibung der Austausch 
einer oder mehrerer Aminosauren durch eine oder rnehrere Aminosauren 
30 zu verstehen. Bevorzugt werden sog. konservative Austausche 
durchgefuhrt, bei denen die ersetzte Aminosaure eine Shnliche 
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Eigenschaft hat wie die ursprungiiche Aminosaure, beispielsweise 
Austausch von Glu durch Asp, Gin durch Asn, Val durch He, Leu durch lie, 
SerdurchThr. 

5 Deletion ist das Ersetzen einer Aminosaure durch erne direkte Bindung. 
Bevurzugte Posilionen fur Deletionen sincl die Termini des Polypeptids 
und die Verknupfungen zwischen den einzelnen Proteindornanen. 

insertionen sind Einfiigungen von Aminosauren in die Polypeptidkette, 
10 wobei formal eine direkte Bindung durch ein oder mehrere Aminosauren 
ersetzt wird. 

Unter Identitat zwischen zwei Proteinen wird die Identitat der Aminosauren 
Qber die jeweils gesamte Proteinlange verstanden, insbesondere die 
15 identitat die durch Vergleich mit Hilfe der Lasergene Software der Firma 
DNASTAR, inc. Madison, Wisconsin (USA) unter Anwendung der Clustal 
Methode (Higgins DG, Sharp PM Fast and sensitive multiple sequence 
alignments on a microcomputer. Comput Appl. Biosci. 1989 Apr;5(2):151- 
1) unter Einstellung folgender Parameter berechnet wird: 

20 

Multiple alignment parameter: 
Gap penalty 10 
Gap length penalty 10 
Pairwise alignment parameter: 
25 K-tuple 1 

Gap penalty 3 
Window 5 
Diagonals saved 5 

30 Unter einem Protein, das eine Identitat von mindestens 20 % 
auf Aminosaureebene mit der Sequenz SEQ ID MO: 12 oder 26 oder 30 
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aufweist, wird dementsprechend ein Protein verstanden, das bei einem 
Vergleich seiner Sequenz mit der Sequenz SEQ ID NO: 12 oder 26 oder 
30, insbesondere nach obigen Programmlogarithmus mit obigem 
Parametersatz eine Identitat von mindestens 20 %, bevorzugt 80,%, 85%, 
5 besonders 90%, insbesondere 95% aufweist. 

Geeignete Nukleinsauresequenzen sind beispielsweise durch 
Ruckubersetzung der Polypeptidsequenz gemaft dem genetischen Code 
erhaitlich. 

10 

Bevorzugt werden dafur solche Codons verwendet, die entsprechend der 
Blakesleaaspezifischen codon. usage haufig verwendet werden. Die codon 
usage lasst sich anhand von Computerauswertungen anderer, bekannter 
Gene von Organismen der Gattung Biakesleaa leicht ermitteln. 

15 

In einer besonders bevorzugten AusfOhrungsform bringt man eine 
Nukieinsaure, enthaltend die Sequenz SEQ ID NO: 1 1 in die Organismus 
der Gattung ein. 

20 In einer weiteren, besonders bevorzugten AusfOhrungsform bringt man 
eine Nukieinsaure, enthaltend die Sequenz SEQ ID NO: 25 in die 
Organismus der Gattung ein. 

In einer weiteren, besonders bevorzugten AusfOhrungsform bringt man 
25 eine Nukieinsaure, enthaltend die Sequenz SEQ ID NO: 29 in die 
Organismus der Gattung ein. 

Alle vorstehend erwShnten Ketoiase-Gene sind weiterhin in an sich 
bekannter Weise durch chemische Synthese aus den Nukleotidbausteinen 
30 wie beispielsweise durch Fragmentkondensation einzelner uberlappender, 
komplementarer Nukleinsaurebausteine der Doppelhelix herstellbar. Die 
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chemische Synthese von Oligonukleotiden kann beispielsweise, in 
bekannter Weise, nach der Phosphoamiditmethode (Voet, Voet, 2. 
Auflage, Wiley Press New York, S. 896-897) erfolgen. Die Anlagerung 
synthetischer Oligonukleotide und Auffiillen von Liicken mithilfe des 
5 Klenow-Fragmentes der DNA-Poiymerase und Ligationsreaktionen sowie 
allgemeine Klonierungsverfahren werden in Sambrook et a!. (1989), 
Molecular cloning: A laboratory manual, Cold Spring Harbor Laboratory 
Press, beschrieben. 

10 Der in der Transformation (i) eingesetzte Vector umfasst daher in einer 
Ausfuhrungsform der Erfindung bevorzugterweise eine Sequenz 
codierend fur eine Ketolase, insbesondere der Ketolase Nostoc 
punctiforme aus mit der SEQ ID NO: 72. 

15 Unter Hydroxylase-Aktivitat die Enzymaktivitat einer Hydroxylase 
verstanden. 

Unter einer Hydroxylase wird ein Protein verstanden, das die 
enzymatische Aktivitat aufweist, am, gegebenenfails substituierten, (5- 
.20 lonon-Ring von Carotinoiden eine Hydroxy-Gruppe einzufuhren. 

Insbesondere wird unter einer Hydroxylase ein Protein verstanden, das 
die enzymatische Aktivitat aufweist, J3-Carotin in Zeaxanthin oder 
Cantaxanthin in Astaxanthin umzuwandeln. 

25 

Dementsprechend wird unter Hydroxyase-Aktivitat die in einer bestimmten 
Zeit durch das Protein Hydroxylase umgesetzte Menge p-Carotin oder 
Cantaxanthin bzw. gebifdete Menge Zeaxanthin oder Astaxanthin 
verstanden. 

30 
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Bet einer erhohten Hydroxylase-Aktivitat gegenuber dem Wildtyp wird 
somit im Vergieich zum Wildtyp in einer bestimmten Zeit durch das Protein 
Hydroxylase die umgesetzte Menge p-Carotin Oder Canthaxantin bzw. die 
gebiidete Menge Zeaxanthin oder Asiaxanthin erhoht. 

5 

Vorzugsweise betragt diese ErhOhung der Hydroxylase-Aktivitat 
mindestens 5 %, weiter bevorzugt mindestens 20 %, weiter bevorzugt 
mindestens 50%, weiter bevorzugt mindestens 100%, bevorzugter 
mindestens 300 %, noch bevorzugter mindestens 500 %, insbesondere 
10 mindestens 600 % der Hydroxylase-Aktivitat des Wildtyps. 

Die Bestimmung der Hydroxylase-Aktivitat in erfindungsgemafien 
genetisch veranderten Organismen und in Wildtyp- bzw. Referenz- 
Organismen erfolgt vorzugsweise unter folgenden Bedingungen: 

15 

Die Aktivitat der Hydroxylase wird nach Bouvier et ai. (Biochim. Biophys. 
Acta 1391 (1998), 320-328) in vitro bestimmt. Es wird zu einer bestimmten 
Menge an Organismenextrakt Ferredoxin, Ferredoxin-NADP 
Oxidoreductase, Katalase, NADPH sowie beta-Carotin mit Mono- und 
20 Digalaktosylgiyzeriden zugegeben. 

Besonders bevorzugt erfolgt die Bestimmung der Hydroxylase-Aktivitat 
unter folgenden Bedingungen nach Bouvier, Keller, d'Harlingue und 
Camara (Xanthophyil biosynthesis: molecular and functional 
25 characterization of carotenold hydroxylases from pepper fruits (Capsicum 
annuum L; Biochim. Biophys. Acta 1391 (1998), 320-328): 

Der in-vitro Assay wird in einem Volumen von 0,250 ml Voiumen 
durchgefuhrt. Der Ansatz enthalt 50 mM Kaliumphosphat (pH 7,6), 0,025 
30 mg Ferredoxin von Spinat, 0,5 Einheiten Ferredoxin-NADP-i- 
Oxidoreduktase von Spinat, 0,25 mM NADPH, 0,010 mg beta-Carotin (in 



WO 2004/063358 



PCT/EP2004/000100 



27 

0,1 mg Tween 80 emulgiert), 0,05 mM einer Mischung von Mono- und 
Digalaktosylglyzeriden (1:1), 1 Einheit Katalyse, 200 Mono- und 
Digalaktosylglyzeriden, (1:1), 0,2 mg Rinderserumalbumin und 
Organismenextrakt in unterschiedlichem Volumen. Die 
5 Reaktionsmischung wird 2 Stunden bei 30°C inkubiert. Die 
Reaktionsprodukte werden mit organischem Losungsmittel wie THF, 
Aceton Oder Chloroform/Methanol (2:1) 'extrahiert und mittels HPLC 
bestimmt. 

10 Besonders bevorzugt erfolgt die Bestimmung der Hydroxylase-Aktivitat 
unter folgenden Bedingungen nach Bouvier, d'Harlingue und Camara 
(Molecular Analysis of carotenoid cyciae inhibition; Arch. Biochem. 
Biophys. 346(1) (1997) 53-64): 

15 Der in-vitro Assay wird in einem Volumen von 250 pi Volumen 
durchgefuhrt. Der Ansatz enthalt 50 mM Kaliumphosphat 
(pH 7,6),unterschiedliche Mengen an Organismenextrakt, 20 nM Lycopin, 
250 ug an chromoplastidarem Stromaprotein aus Paprika, 0,2 mM 
NADP+, 0.2 mM NADPH und 1 mM ATP. NADP/NADPH und ATP werden 

20 in 10 ml Ethanol mit 1 mg Tween 80 unmittelbar vor der Zugabe zum 
Inkubationsmedium gelost Nach einer Reaktionszeit von 60 Minuten bei 
30°C wird die Reaktion durch Zugabe von Chloroform/Methanol (2:1) 
beendet. Die in Chloroform extrahierten Reaktionsprodukte werden mittels 
HPLC analysiert. 

25 

Ein alternativer Assay mit radioaktivem Substrat ist beschrieben in Fraser 
und Sandmann (Biochem. Biophys. Res. Comm. 185(1) (1992) 9-15). 

Die Erhohung der Hydroxylase-Aktivitat kann durch verschiedene Wege 
30 erfolgen, beispielsweise durch Ausschalten von hemmenden 
Reguiationsmechanismen auf Expressions- und Proteinebene oder durch 
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Erhohung der Genexpression von Nukleinsauren kodierend eine 
Hydroxylase gegenOber dem Wildtyp. 

Die Erhohung der Genexpression der Nukleinsauren kodierend eine 
5 Hydroxylase gegenOber dem Wildtyp kann ebenfalls durch verschiedene 
Wege erfolgen, beispielsweise durch Induzierung des Hydroxyiase-Gens 
durch Aktivatoren oder durch Einbringen von einer oder mehrerer 
Hydroxylase-Genkopien, also durch Einbringen mlndestens elner 
Nukleinsaure kodierend eine Hydroxylase in denb Organismus der 
10 Gattung Blakesleaa. 

In einer bevorzugten AusfQhrungsform erfoigt die Erh6hung der 
Genexpression einer Nukleinsaure kodierend eine Hydroxylase durch 
Einbringen von mindestens einer Nukleinsaure kodierend eine 
15 Hydroxylase in den Organismus der Gattung Blakesleaa. 

Dazu kann prinzipiell jedes Hydroxylase-Gen, also jede Nukleinsaure, die 
eine Hydroxylase codiert, verwendet werden. 

20 Bei genomischen Hydroxylase-Sequenzen aus eukaryontischen Quellen, 
die Introns enthalten, sind fUr den Fail, dass der Wirtsorganismus nicht in 
der Lage ist oder nicht in die Lage versetzt werden kann, die 
entsprechende Hydroxylase zu exprimieren, bevorzugt bereits 
prozessierte Nukleinsauresequenzen, wie die entsprechenden cDNAs zu 

25 verwenden. 

Ein Beispiel fur ein Hydroxylase-Gen ist eine Nukleinsaure, kodierend eine 
Hydroxylase aus Haemaiococcus piuvialis mit der Accession No. 
AX038729 (WO 0061764; Nukleinsaure: SEQ ID NO: 31, Protein: SEQ ID 
30 NO: 32), aus Erwinia uredovora 20D3 (ATCC 19321, Accession No. 
D9Q087; Nukleinsaure: SEQ ID NO: 33, Protein: SEQ ID NO: 34) Oder 
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Hydroxylase aus Thermus thermophilus (DE 102 34 126.5) kodiert durch 
die Sequenz mit der SEQ ID NO 76. 

Weitere Hydroxyiasen werden von den Nukleins§uren rnit den foigenden 

5 Accession Islummern kodiert 

lemb|CAB55626.1, CAA70427.1, CAA70888.1, CAB55625.1, 
AF499108J, AF315289J, AF296158J, AAC49443.1, NPJ94300.1, 
NP_200070.1, AAG10430.1, CAC06712.1, AAM88619.1, CAC95130.1, 
AAL80006.1, AF162276J, AA053295.1, AAN85601.1, CRTZ_ERWHE, 

10 CRTZ„PANAN, BAB79605.1, CRTZ_ALCSP, CRTZ_AGRAU , 
CAB56060.1, ZPJ)0094836.1, AAC44852.1, BAC77670.1, NP_745389.1, 
NP_344225.1, NP_849490.1, ZP„00087019.1, NP_503072.1, 
NP_852012.1, NP_1 15929.1, ZP„00013255.1 

15 In den erfindungsgemalien bevorzugten transgenen Organismen der 
Gattung Blakeslea liegt also in dieser bevorzugten Ausfuhrungsform 
gegenQber dem Wildtyp mindestens ein Hydroxylase-Gen vor. 

fn dieser bevorzugten Ausfuhrungsform weist der genetisch veranderte 
20 Organismus beispielsweise mindestens eine exogene Nukleinsaure, 
kodierend eine Hydroxylase auf. 

Bevorzugt verwendet man in vorstehend beschriebener bevorzugter 
Ausfuhrungsform als Hydroxy!ase-Gene Nukieinsauren, die Proteine 

25 kodieren, enthaltend die Aminosauresequenz SEQ ID NO: 32, 34 oder 
kodiert durch die Sequenz mit der SEQ ID NO 76 oder eine von dieser 
Sequenz durch Substitution, Insertion oder Deletion von Aminosauren 
abgeleitete Sequenz, die eine Identitat - von mindestens 30 %, 
vorzugswetse mindestens 50%, bevorzugter mindestens 70%, noch 

30 bevorzugter mindestens 80%, am bevorzugtesten mindestens 90%, 
insbesondere 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% auf 
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Arninosaureebene mil der Sequenz SEQ. ID. NO: 32, 34 oder kodiert 
durch die Sequenz mit der SEQ ID NO 76 und die die enzymatische 
Eigenschaft einer Hydroxylase aufweisen. 

5 Weitere Beispiele fur Hydroxylasen und Hydroxylase-Gene lassen sich 
beispielsweise aus verschiedenen Organismen, deren genomische 
Sequenz bekannt ist, wie vorstehend beschrieben, durch 
Homologievergleiche der Aminosauresequenzen oder der entsprechenden 
rtickubersetzten Nukleinsauresequenzen aus Datenbanken mit der SEQ 
10 ID. NO: 31 , 33 oder 76 leicht auffinden. 

Weitere Beispiele fur Hydroxylasen und Hydroxylase-Gene lassen sich 
weiterhin beispielsweise ausgehend von der Sequenz SEQ ID NO: 31, 33 
oder 76 aus verschiedenen Organismen deren genomische Sequenz nicht 
15 bekannt ist, wie vorstehend beschrieben, durch Hybridisierungs- und 
PCR-Technikeri in an sich bekannter Weise leicht auffinden. 

In einer welter besonders bevorzugten Ausfuhrungsform werden zur 
Erhdhung der Hydroxylase-Aktiviiat Nukleinsauren in Organismen 
20 eingebracht, die Proteine kodieren, enthaltend die Aminosauresequenz 
der Hydroxylase der Sequenz SEQ ID NO: 32, 34 oder kodiert durch die 
Sequenz mit der SEQ ID NO 76. 

Geeignete Nukleinsauresequenzen sind beispielsweise durch 
25 RQckubersetzung der Polypeptidsequenz gcmafS dem genotischen Code 
erhaltlich. 

Bevorzugt werden dafur solche Codons verwendet, die entsprechend der 
Organismenspezifischen codon usage hauflg verwendet werden. Die 
30 codon usage lasst sich anhand von Computerauswertungen anderer, 
bekannter Gene der betreffenden Organismen leicht ermitteln. 
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In einer besonders bevorzugten Ausfuhrungsform bringt man sine 
Nukleinsaure, enthaitend die Sequenz SEQ. ID. NO: 31, 33 oder 76 in den 
Organismus ein. 

5 

Aile vurstehend erwahnten Hydroxylase-Gene sind weiterhin in an sich 
bekannter Weise durch chemische Synthese aus den Nukleotidbausteinen 
wie beispieisweise durch Fragmentkondensation einzelner iiberiappender, 
komplementarer Nukleinsaurebausteine der Doppelhelix herstellbar. Die 

10 chemische Synthese von Oligonukleotiden kann beispieisweise, in 
bekannter Weise, nach der Phosphoamiditmethode (Voet, 2. Auflage, 
Wiley Press New York, Seite 896-897) erfolgen. Die Anlagerung 
synthetischer Oligonukleotide und Auffulien von Lucken mithilfe des 
Klenow-Fragmentes der DNA-Polyrnerase und Ligationsreaktionen sowie 

15 allgemeine Klonierungsverfahren werden in Sambrook et ai. (1989), 
Molecular cloning: A laboratory manual, Cold Spring Harbor Laboratory 
Press, beschrieben.. 

Der in der Transformation (i) eingesetzte Vector umfasst daher in weiteren 
20 AusfQhrungsformen der Erfindung bevorzugterweise eine Sequenz 
codierend fur eine Hydroxlase, insbesondere eine Hydroxiase aus 
Haematococcus pluvialis mit der SEQ ID NO: 70 oder eine Hydroxlase aus 
Erwinia uredova mit der SEQ ID NO: 71. oder eine Hydroxylase aus 
Thermus thermophilus kodiert durch die Sequenz mit der SEQ ID NO 76. 

25 

Der in der Transformation (i) eingesetzte Vector enthalt vorzugsweise 
ferner die Expression regelnde und unterstDtzende Bereiche, 
insbesondere Promotoren und Terminatoren. 

30 Der in der Transformation (i) eingesetzte Vector enthalt vorzugsweise den 
gpd und/oder den ptefl Promotor und/oder den trpC Terminator. Diese 
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haben sich zur Transformation der Blakeslea besonders bewahrt. Auch 
der Einsatz von dem Fachmann geiauftgen "inverted repeats" (IR, Rompp 
Lexikon der Biotechnologie 1992, Thieme Vertag Stuttgart, Seite 407 
"Invers repetitive Sequenzen") zur Regelung der Expression bzw. 
5 Transkription liegt im Rahmen der Erfindung. 

Vorteilhafterweise weist der im Vector eingesetzte gpd Promotor die 
Sequenz SEQ ID NO: 1 auf. Vorteilhafterweise weist der im Vector 
eingesetzte trpC Terminator die Sequenz SEQ ID NO: 2 auf. 
10 Vorteilhafterweise weist der im Vector eingesetzte ptefi Promotor die 
Sequenz SEQ ID NO: 35 auf. 

insbesondere werden dabei der gpd Promotor und der trpC Terminator 
aus Aspergillus nidulans und der ptefi Promotor aus Blakeslea trispora 
15 eingesetzt. 

Insbesondere enthalt der in der Transformation (i) eingesetzte Vector ein 
Resistenzgen. Bevorzugterweise handelt es sich urn ein Hygromycin- 
Resistenzgen (hph), insbesondere das aus E. coli. Dieses Resistenzgen 
20 hat sich bei dem Nachweis der Transformation und Selektion der Zeflen 
als besonders geeignet herausgesteilt. 

Als Promotor fur hph wird also bevorzugt p-gpdA, der Promotor der 
Glycerinaldehyd-3-pbosphatdehydrogenase aus Aspergillus nidulans 
25 genutzt. Als Terminator fur hph wird bevorzugt t-trpC, der Terminator des 
Gens trpC, codierend fDr Anthranilatsynthasekomponenten aus 
Aspergillus nidulans genutzt. 

Als Vectoren haben sich Abkommlinge des pBinAHyg Vectors als 
30 besonders geeignet herausgesteilt. Der zur Transformation eingesetzte 
Vector umfasst also bevorzugterweise die SEQ ID NO: 3. 
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Hinzu kommen je nach gewunschtem Carotinoid oder dessen Vorstufe 
eine Sequenz codierend fur eine Hydroxylase, Ketolase, 
Phytoendesaturase usw. wie diese zuvor beschrieben wurden. Die 
Vectoren umfassen also in einer Ausfuhrugsform der Erfndung die 
5 Sequenz SEQ ID NO: 69 codierend fur die Phytoendesaturase. Die 
Vectoren umfassen ferner in einer weiteren Ausfuhrugsform der Erfndung 
die Sequenz SEQ ID NO: 72 codierend fur eine Ketolase. Die Vectoren 
umfassen weiter in einer weiteren Ausfuhrugsform der Erfndung die 
Sequenz SEQ ID NO: 70 oder 71 oder 76 codierend fur eine Hydoxylase. 
10 Entsprechende Kombinationen der zuvorgenannten Sequenzen iiegen 
ebenso im Rahmen der Erfindung. So umfasst der Vector in einer 
Ausfuhrungsform sowohl eine Sequenz SEQ ID NO: 72 codierend fur eine 
Ketolase als auch die Sequenz SEQ ID NO: 70 oder 71 oder 76 codierend 
fQr eine Hydoxylase und ermogiicht so die Hersteilung von Astaxanthin. 

15 

Insbesondere sind Vectoren ausgewahlt aus der Gruppe bestehend aus 
den SEQ ID NO: 37 bis 51 und 62 im Rahmen der Erfindung einsetzbar. 

Mit dem erfindungsgemafien Verfahren sind gentechnisch veranderte 
20 Organismen Blakeslea, insbesondere der Art Blakeslea trispora bzw. aus 
ihnen gebildetes Mycel erhaltlich. 

Die genetisch veranderten Organismen konnen zur Produktion von 
Carotinoiden, Xanthophyllen oder deren Vorstufen, insbesondere Phytoen, 
25 Bixion, Astaxanthin, Zeaxanthin und Canthaxanthin verwendet werden. 
Auch konnen neue, im Wildtyp naturlicherweise nicht vorkommende 
Carotinoide durch Einbringung der entsprechenden genetischen 
Information von den gezielt genetisch veranderten Zellen bzw. dem durch 
sie gebildeien Mycel erzeugt und anschlieBend Isollert werden. 

30 
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Bevorzugterweise ist die Gewinnung von Caratinoiden oder deren 
Vorstufert mit den gezielt genetisch veranderten Zellen bzw. das durch ste 
gebildete Mycel moglich. 

■5 Wird die gentechnische Veranderung nur in Zellen eines der 
vorkommenden Paarung3typen (bei Blakeslea trispora (+) oder (-)) 
durchgefuhrt, so wird zur Kultivierung der entsprechend andere, nicht 
veranderte Paarungstyp zugesetzt, da so eine gute Produktion der 
Carotinoide oder deren Vorstufen aufgrund der von dem zweiten, nicht 

10 veranderten Paarungstyp abgegebenen Substanzen (z. B. Trisporsauren) 
zu erreichen ist. Vorteilhafterweise wird jedoch die gentechnische 
Veranderung in Zellen beider Paarungstypen vorgenommen und diese 
zusammen kultiviert. Hierdurch wird ein besonders gutes Wachstum und 
eine optimale Produktion der Carotinoiden oder deren Vorstufen erreicht. 

15 Auch eine (kunstliche) Zugabe der Trisporsauren ist moglich und sinnvoll. 

Trisporsauren sind Sexualhormone in Mucorales Pilzen, wie Blakeslea, 
welche die Bildung von Zygophoren und die Produktion von P-Carotin 
stimulieren (van den Ende 1968, J. Bacteriol. 96:1298 - 1303, Austin et al. 
20 1969, Nature 223:1178 - 1179, Reschke Tetrahedron Lett. 29:3435 - 
3439, van den Ende 1970, J. Bacteriol. 101:423 - 428). 

Die Erfindung wird nachfolgend an Hand von Beispieien naher ausgefiihrt. 

25 Material und Methoden 

Molekuiargenetische Arbeiten wurden, wenn nicht anders beschrieben, 
nach den Methoden in Current Protocols in Molecular Biology (Ausubei et 
ai., 1999, John Wiley & Sons) durchgefuhrt. 

30 Stamme und Wachstumsbedingungen 
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Die Blakeslea trispora Stamme ATCC 14271 (Paarungstyp{+)) und 
ATCC 14272 (Paarungstyp (-)) wurden von der American Type Culture 
Collection erhaiten. Die Anzucht von B. trispora erfoigte in MEP-Medium 
(Malzextrakt-Pepton-Medium): 30 g/l Malzextrakt (Difco), 3 g/i Pepton 
5 (Soytone, Difco), 20 g/l Agar, Einstellung pH 5,5, ad 1000 ml mit H 2 0 bei 
28 °C. 

Die Anzucht von Agrobacterium tumefaciens LBA4404 erfoigte nach 
Hoekema et al. (1983, Nature 303:179-180) bei 28 °C fOr 24 h in 
w Agrobacterien-Minimal Medium (AMM): 10 mM K 2 HP0 4 , 10 mM KH2PO4, 
10 mM Glucose, MM-Salze (2,5 mM NaCI, 2 mM MgS0 4 , 700 pM CaCI 2( 9 
pM FeS0 4 , 4 mM (NH 4 ) 2 S0 4 ). 

Transformation von Agrobacterium tumefaciens 

15 Das Plasmid pBinAHyg wurde in den Agrobakterienstamm LBA 4404 
(Hoekema et ai„ 1983, Nature 303:179-180) elektroporiert (Mozo and 
Hooykaas, 1991, Plant Mol. Biol. 16:917-918). Zur Seiektion wurden bei 
der Agrobaktertenanzucht folgende Antibiotika verwendet: Rifamptcin 50 
mg/l (Seiektion auf das A. tumefaciens Chromosom), Streptomycin 30 mg/I 

20 (Seiektion auf das Helferplasmid) und Kanamycin 100 mg/l (Seiektion auf 
den binaren Vektor). 

Transformation von Blakeslea trispora 

Zur Transformation wurden die Agrobakterien nach 24 h Anzucht in AMM 
25 auf elne OD 60 o von 0,15 in Induktionsmedium (IM: MM-Salze, 40 mM MES 
(pH 5,6), 5 mM Glucose, 2 mM Phosphat, 0,5% Glycerol, 200 uM 
Acetosyringone) verdQnnt und erneut iiber Nacht in IM bis zu einer OD 6 oo 
von ca. 0,6 angezogen. 

30 Zur Co-lnkubation von Blakeslea ATCC 14271 bzw. ATCC14272 und 
Agrobacterium wurden 100 pi Agrobakteriensuspension mit 100 pi 
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Blakeslea Sporensuspension (10 7 Sporen/ml in 0,9% NaCl) gemischt und 
sterii auf einer Nylon Membran (Hybond N, Amersham) auf IM-Agarose 
Platten (IM + 18 g/l Agar) verteilt. Nach 3 Tagen Inkubation bei 26 °C 
wurde die Membran auf eine MEP-Agarplatte (30 g/l Malzextrakt, 3 g/l 
5 Pepton, pH 5,5, 18 g/l Agar) Qberfuhrt. Zur Seiektion auf transformierte 
Blakesieazellen enthielt das Medium Hygromycin in einer Konzentration 
von 100 mg/l sowie zur Setektion gegen Agrobakterien 100 mg/I 
Cefotaxim. Die Inkubation erfolgte fur ca. 7 Tage bei 26 °C. AnschlieGend 
erfolgte der Transfer von Mycel auf frische Selektionsplatten. Gebildete 

10 Sporen wurden mit 0,9% NaCl abgespult und auf CM 17-1 -Agar (3 g/l 
Glucose, 200 mg/l L-Asparagin, 50 mg/l MgS0 4 x 7H 2 0, 150 mg/l KH 2 P0 4 , 
25 jjg/l ThiaminHCI, 100 mg/l Yeast Extract, 100 mg/l Na-desoxycholat, 
100 mg/L Hygromycin, 100 mg/L Cefotaxim, pH 5,5,18 g/l Agar) 
ausplattiert. Zur isolierung einzelner gentechnisch verSnderter Sporen 

15 wurden die Sporen durch ein FACS Germ der Fa. BectonDickson (Model! 
Vantage+Diva Option) einzeln auf Selektivmedium abgelegt. 

Hersteliung genetisch veranderter Blakeslea trispora durch 
Agrobacterium-vermittelte Transformation 
20 Hersteliung des rekombinanten Plasmids pBinAHyg 

Aus dem Plasmid pANsCosI (Fig.1, Osiewacz, 1994. Curr. Genet. 26:87- 
90, SEQ ID NO: 4) wurde die gpdA-hph-trpC-Kassette als Bglll/Hindlll 
Fragment isoiiert und in das mit BamHI/Hindlll geoffnete binare Plasmid 
pBin19 (Bevan, 1984, Nucleic Acids Res. 12:8711-8721) iigiert. Der so 

25 erhaltene Vektor wurde als pBinAHyg bezeichnet (Fig. 2, SEQ ID NO: 3) 
und enthielt das £. coli Hygromycin-Resistenzgen (hph) unter Kontrolle 
des gpd Promotors (SEQ ID NO: 1) und des trpC Terminators (SEQ ID 
NO: 2) aus Aspergillus nidulans sowie die entsprechenden 
Bordersequenzen, die fur den DNA-Transfer von Agrobacterium 

30 notwendig sind. Die in den weiter unten beschriebenen 
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AusfOhrungsbeispielen genannten Vektoren sind Abkommiinge von 
pBinAHyg. 

Obertragung von pBfnAHyg und Abkommlingen von pBinAHyg in 
5 Agrobacterium tumefaciens 

Nachfolgend wird beispielhaft die Obertragung des Plasmids pBinAHyg in 
Agrobacterien beschrieben. Die Obertragung der Abkommiinge erfolgte 
analog. 

10 Das Plasmid pBinAHyg wurde in den Agrobakterlenstamm LBA 4404 
(Hoekema et a!., 1983, Nature 303:179-180) elektroporiert (Mozo and 
Hooykaas, 1991, Plant Mol. Biol. 16:917-918). Zur Selektion wurden bei 
der Agrobakterienanzucht folgende Antibiotika verwendet: Rifampicin 50 
mg/l (Selektion auf das A. tumefaciens Chromosom), Streptomycin 30 mg/l 

15 (Selektion auf das Helferplasmid) und Kanamycin 100 mg/i (Selektion auf 
den binaren Vektor). 

Obertragung von pBinAHyg und Abkommlingen von pBinAHyg in 
Blakeslea trispora 

20 Zur Transformation wurden die Agrobakterien nach 24 h Anzucht in AMM 
auf eine ODeeo von 0,15 in induktionsmediurn (IM: MM-Salze, 40 mM MES 
(pH 5,6), 5 mM Glucose, 2 mM Phosphat, 0,5% Glycerol, 200 uM 
Acetosyringone) verdunnt und erneut uber Nacht in IM bis zu einer OD 6 eo 
von ca. 0,6 angezogen. 

25 

Zur Co-Inkubation von Blakeslea trispora (B.t) und Agrobacterium 
tumefaciens (A.t.) wurden 100 pi Agrobakteriensuspension mit 100 pi 
Blakeslea Sporensuspension (10 7 Sporen/ml in 0,9% NaCI) gemischt und 
steril auf einer Nylon Membran (Hybond N, Amersham) auf IM-Agarose 
30 Platten (IM + 18 g/l Agar) verteift. Nach 3 Tagen Inkubatton bei 26 °C 
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wurde die Membran auf eine MEP-Agarplatte (30 g/i Malzextrakt 3 g/l 
Pepton, pH 5,5, 18 g/l Agar) uberfQhrt. 

Zur Selektion auf transformierte Blakeslea-Zellen enthielt das Medium 
5 Hygromycin in einer Konzentration von 100 mg/l sowie zur Selektion 
gegen Agrobakterien 100 mg/l Cefotaxim. Die Inkubation erfolgte fOr ca. 7 
Tage bei 26 °C. Anschlieftend erfolgte der Transfer von Mycel auf frische 
Selektionsplatten. Gebildete Sporen wurden mit 0,9% NaCI abgespult und 
auf CM 17-1 -Agar (3 g/l Glucose, 200 mg/l L-Asparagin, 50 mg/l MgS0 4 x 
10 7H 2 0, 150 mg/l KH2P04, 25 ug/i Thiamin-HCi, 100 mg/l Yeast Extract, 
100 mg/l Na-desoxycholat, pH 5,5, 100 mg/l Cefotaxim, 100 mg/l 
Hygromycin, 18 g/l Agar) ausplattiert. Die Obertragung von Sporen auf 
frische Selektionsplatten wurde dreimal wiederholt. Auf diese Weise wurde 
die Transformante Biakeslea trispora GVO 3005 isoiiert. Alternativ erfolgte 
15 zur Selektion der GVO (gentechnisch veranderten Organismen) die 
Einzelabiage der Sporen durch den BectonDickinson FacsVantage+Diva 
Option auf CM-17 Agar mit 100 mg/l Cefotaxim, 100 mg/l Hygromycin. In 
diesem Fall wurde nur dort Pilzmycel gebildet, wo die Sporen 
gentechnisch verandert waren. 

20 

Nachweis der genetischen Veranderung durch Obertragung von 
pBinAHyg und Abkommlingen von pBinAHyg in Biakeslea trispora 

Nachfolgend wird beispielhaft der Nachweis der Obertragung fur 
pBinAHyg in Biakeslea trispora beschrieben. Der Nachweis der 
25 Obertragung der Abkommlinge erfolgte analog. 

200 ml MEP-Medium {30 g/l Malzextrakt, 3 g/l Pepton, pH 5,5) wurden mit 
10 5 bis 10 7 Sporen der Transformante Biakeslea trispora GVO 3005 
beimpft und 7 Tage bei 26 "C mit 200 Uprn auf einem Rundschuttler 
30 inkubiert. Zum Nachweis der erfolgreichen Transformation wurde DNA aus 
dem Mycei isoiiert (Peqlab Fungal , DNA Mini Kit) und in einer PCR 
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(Programm: 94 °C 1 rnin, dann 30 Zyklen mit 1 min. 94°C, 1 min. 58 °C, 1 
min. 72 °C) eingesetzt. 

Zum Nachweis des Hygromycinresistenzgens (hph) wurden die Primer 
5 hph-forward (5'~CGATGTAGGAGGGCGTGGATA, SEQ ID NO: 5) und 
hph-reverse (5'-GCTTCTGCGGGCGATTTGTGT, SEQ ID NO: 6) 
verwendet. Das erwartete Fragment von hph wies eine Lange von 800 bp 
auf. 

10 Zur Amplication des Kanamycinresistenzgens nptlll und damit als 
Kontrolle auf Agrobakterien wurden die Primer nptlll-forward (5- 
TGAGAATATCACCGGAATTG, SEQ ID NO: 7) und npt! I [-reverse (5'- 
AGCTCGACATACTGTTCTTCC, . SEQ ID NO: 8) verwendet. Das 
erwartete Fragment von nptlll wies eine Lange von 700 bp auf. 

15 

Zur Amplifikation eines Fragmentes des Glycerinaldehyd-3- 
phosphatdehydrogenasegens gpdl und damit ais Kontrolle auf Blakeslea 
trispora wurden die Primer MAT292 (5'- 
GTGAATGGAAATCCCATCGCTGTC, SEQ ID NO: 9) und MAT293 (5'- 
20 AGTGGGTACTCTAAAGGCCATACC, SEQ ID NO: 10) verwendet. Das 
erwartete Fragment von gpdl wies eine Lange von 500 bp auf. 

Das Ergebnis der PCR der Blakeslea trispora DNA ist in Fig. 3 anhand 
eines Standard-Gels gezeigt. Die Spuren des Gels wurden 
25 folgenderma&en belegt: 

1) 100 bp Grofcenmarker (100 bp - 1 kb) 

2) B.t. GVO 3005 primer nptlll-for / nptlll-rev 

3) B.t. GVO 3005 primer hph-for / hph-rev 

30 A) B.t. GVO 3005 primer MAT292 / MAT293 (gpd) 

5) At. mit Piasmid pBinAHyg primer nptlll-for / nptlll-rev 
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6) A.t. mit Plasmid pBinAHyg primer hph-for / hph-rev 

7) B.t. 14272 WT primer nptllf-for / nptlll-rev 

8) B.t. 1 4272 WT primer hph-for / hph-rev 

9) B.t. 14272 WT primer MAT292 / MAT293 (gpd) 

5 

In der DNA von Blakeslea trispora wurde das I lygromycinresistenzgens 
(hph) und als Positivkontrolle Glycerinaldehyd~3- 
phosphatdehydrogenasegen (gpdl) nachgewiesen. nptfll konnte 
demgegenuber nicht nachgewiesen werden. 

10 

Somit wurde die genetische Veranderung von Blakeslea trispora durch 
Agrobacterium-vermittelte Transformation nachgewiesen. 

IsoEierung homokaryotischer GVO von Blakeslea trispora: 

15 Durch erfolgreichen Transfer des Vectors pBinAHyg und Abkommlingen 
von pBinAHyg in Blakeslea trispora entstehen genetisch veranderte 
Organismen (GVO) von Blakesiea trispora. Jedoch liegen in Blakeslea in 
alien Stadien des vegetativen und des sexuellen Zelizyklus mehrkernige 
Zellen vor. Daher erfolgt die Insertion der Fremd-DNA in der Regel nur in 

20 einem Kern. Ziel ist es, Stamme von Blakesiea zu erhalten, bei denen die 
Insertion der Fremd-DNA in alien Kernen vorliegt, d.h. Ziel ist ein 
homonukleates rekombinantes Pilzmycel. 

1) Herstellung homonukleater rekombinanter Stamme durch FACS 
25 (fluorescence-activated cell sorting) 

Ein geringer Anteil der Sporen von Blakeslea trispora bzw. der 
gentechnisch veranderten Stamme von Blakeslea trispora ist von Natur 
aus einkernig. Zur Herstellung homonukleater rekombinanter Stamme, die 
Fremd-DNA von pBinAHyg oder pBinAHyg-Abkommiingen enthielten, 
30 wurden die einkernigen Sporen durch FACS aussortiert und auf MEP {30 
g/l Malzextrakt, 3 g/l Pepton, pH 5,5, 18 g/l Agar) mit 100 mg/l Cefotaxim 
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und 100 mg/i Hygromycin plattiert Die hier gebildten Mycelien waren 
homonukleat. Zur Sortierung mit FACS wurden die Sporen eines 3 Tage 
aiten Ausstriches mit 10 ml Tris-HCI 50mMol + 0,1% Span20 pro Agar- 
Platte abgeschwemmt Die Sporenkonzentration betrug 0,5 bis 0,8 x 10 7 

5 Sporen pro ml. Zu 9 ml Sporensuspension wurden 1ml DMSO und 10 pi 
Syto 1 1 (Farbstoff-Stammiosung in DMSO Molecular Probes Nr.S-7573) 
zugegeben. Danach wurde 2 h bei 30°C gefarbt Selektion und Abiage 
erfolgten mittels eines Gerates vom Typ FacsVantage+Diva Option Fa. 
Becton Dickinson. Die Selektion erfolgte zuerst nach GroBe, urn einzeine 

10 Sporen von Aggregaten und Verunreinigungen zu trennen. Dann wurden 
diese Sporen nach ihrer Fluoreszenz (Anregung = 488nm; Emission = 
530 nm) sortiert abgelegt. Die iinke Schulter der GauE-Kurve der 
Fluoreszenzhaufigkeitsvertetlung enthielt die einkernigen Sporen. 

15 2) Herstellung homonukleater Stamme durch Kernreduktion und 
Selektion mit FACS 

Zur Reduzierung der Anzahl von Kernen pro Spore wurde vor der 
Selektion eine Behandlung von Sporensuspensionen mit MNNG (N- 
Methyl-N -nitro-N-nitrosoguanidin) durcbgefuhrt, und so durch chemische 
20 Mutagenese eine Kernreduktion erzielt. 

Hierfur wurde zunachst eine Sporensuspension mit 1 x 10 7 Sporen/ml in 
Tris/HCl-Puffer, pH 7,0 hergestellt. Der Sporensuspension wurde MNNG 
in einer Endkonzentration von 100 ug/m! zugegeben. Die Zeit der 
25 Inkubation In MNNG wurde so gewahlt, dass die Oberlebensrate der 
Sporen ca. 5% betrug. Nach Inkubation mit MNNG wurden die Sporen 
dreima! mit 1g/i Span 20 in 50 mM Pbosphatpuffer pH 7,0 gewaschen und 
nach der unter 1) beschriebenen Methode sortiert bzw. selektiert. 
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Altemativ konnten zur Reduktion der Kernzah! in den Sporen auch 
Rontgen - und UV-Strahlen eingesetzt werden, wie es von Cerda-Olmedo 
und Patricia Reau in Mutation Res., 9 (1970), 369-384 beschrieben wurde. 

5 3) Herstellung homonukleater Stamme durch Selektion auf rezesslve 
Selektionsmarker 

Ats rezessiver Selektionsmarker zur Selektion homonukleater Myceiien 
kommt beispielsweise der rezessive Selektionsmarker pyrG in Frage. 
Wildtyp-Stamme von Blakesiea trispora sind pyrG + . Diese Stamme konnen 

10 nlcht In Gegenwart des Pyrimidin-AnaJogs 5-Fluororotat (FOA) wachsen, 
weii sie FOA durch die Orotidin-5'-rnonophosphatdecarboxylase zu 
lethalen Metaboliten umsetzen. Gentechnisch veranderte Blakesieaa, die 
homonukieat pyrG" sind, fehlt die Enzymaktivitat Orotidin-5'- 
monophosphatdecarboxylase. Folglich kSnnen diese pyrG'Stamme 5- 

15 Fluororotat nicht verwerten. Die Stamme wachsen daher in Gegenwart 
von FOA und Uracil. Im Fall der Kopplung der Mutation pyrG" und der 
Insertion von Fremd-DNA auf dem Kern einer einkernigen Spore, kann 
aus dieser Spore homonukleates rekombinantes Pilzmycel gebildet 
werden. 

20 

Zunachst wurde durch Insertion eines Fragmentes von pyrG (SEQ ID NO: 
65) aus Blakesiea trispora in pBinAHyg das Plasmid pBinAHygBTpyrG- 
SCO (SEQ ID NO: 36, Fig. 4) erzeugt. Dieses Plasmid wurde in Blakelea 
trispora transformiert und fQhrte dort durch homologe Rekombination zur 
25 Disruption von pyrG. 

Homonukleate GVO von Blakesiea trispora mit dem Phanotyp pyrG" 
wurden folgendermaBen selektiert. Zur Agrobakterium-vermitteiten 
Transformation von pBinAHygBTpyrG-SCO wurde wie oben beschiieben 
30 auf MEP (30 g/l Maizexirakt, 3 g/l Pepton, pH 5,5, 18 g/l Agar) mit 100 
mg/l Cefotaxim und 100 mg/l. Hygromycin piattiert. Die Sporen der 
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Transformanten wurden mit 10 ml Tris-HC! 50mM + 0,1% Span20 pro 
Agar-Platte abgeschwemmt. Die Sporenkonzentration betrug 0,5 bis 0,8 x 
10 7 Sporen pro ml. Die Sporen wurden anschliefiend auf FOA-Medium mit 
100 mg/l Cefotaxim und 100 mg/l Hygromycin ausplattiert. FOA-Medium 

5 enthielt pro Liter 20 g Glucose, 1 g FOA, 50 mg Uracil, 200 ml Citrat-Puffer 
(0,5 M, pH 4,5) und 40 ml Spurensaizlosung nach Sutter, 1975, PNAS, 
72:127). Homonukleate pyrG~-Mutanten zeigten Wachstum auf dem 
Uracil-haltigen FOA-Medium; aber kein Wachstum bei Plattierung auf 
FOA-Medium ohne Uracil. Auf die gleiche Weise wurden aus den im 

10 folgenden beschriebenen GVO von Blakesiea trispora zur Herstellung von 
Xanthophyllen homonukleate GVO hergestellt. 

Alternate ist es moglich die Sporen analog zur Vorschrift von Roncero et 
al. auf Medium mit 5-Carbon-5-deazariboflavin zu plattieren, das 
15 zusatzlich Hygromycin enthalt (Roncero et al., 1984, Mutation Research, 
125: 195 - 204). Hierdurch werden homokaryonte Zellen des Genotyps 
hyg R und dar~ selektiert. Nach diesem Prinzip werden homokaryonte 
Stamme von Blakesiea trispora mit dem Phanotyp hyg R und dar erzeugt. 

20 

AusfCihrungsbeispiele zur Herstellung von gentechnisch veranderten 
Organismen von Blakesiea trispora fur die Herstellung von 
Carotlnoiden und Carotlnoidvorstufen 

25 Die Erzeugung der im folgenden genannten Plasmide erfofgte durch die 
Methode „overiap-extension PCR" und durch anschlieBende Insertion der 
Amplifikationsprodukte in das Plasmid pBinAHyg. Die Methode „overlap- 
extension PCR" erfofgte wie in Innis et al. (Eds.) PCR protocols: a guide to 
methods and applications, Academic Press, San Diego beschrleben. Die 

30 Transformation der pBinAHyg-Abkommlinge und die Herstellung 
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homonukleater gentechnisch veranderter Stamme von Blakeslea trispora 
erfolgt© wie oben beschrieben. 

Gentechnisch veranderte Stamme von Blakeslea trispora ztir 
5 Herstellung von Zeaxanthin 

Folgende Plasmide (Abkommlinge von pBirrAHyg) wurden zur 
gentechnischen Veranderung von Blakeslea trispora fur die Herstellung 
von Zeaxanthin verwendet, codieren also u.a. Hydroxylasen (crtZ): 

p~tef1 -HPcrtZ, enthaltend Gen der Hydroxylase HPcrtZ (SEQ ID 
10 NO: 70) aus Haematococcus pluvialis Flotow NIES-144 (Accession 

No. AF 162276) unter Kontrolle des ptefl Promotors aus Blakeslea 
trispora (Seq. pBinAHygBTpTEFI -HPcrtZ, SEQ ID NO: 37, Fig. 5); 

p-carRA-HPcrtZ, enthaltend Gen der Hydroxylase HPcrtZ aus 
Haematococcus pluvialis Flotow NIES-144 unter Kontrolle des 

15 Promotors pcarRA aus Blakeslea trispora (Seq. pBinAHyg- 

BTpcarRA-HPcrtZ, SEQ ID NO: 38, Fig. 6) 
p-carB-HPcrtZ, enthaltend Gen der Hydroxylase HPcrtZ aus 
Haematococcus pluvialis Flotow NIES-144 unter Kontrolle des 
Promotors pcarB aus Blakeslea trispora (Seq. pBinAHygBTpcarB- 

20 HPcrtZ, SEQ ID NO: 39, Fig. 7) 

p-carRA-HPcrtZ-TAG-3'carA-IR, enthaltend Gen der Hydroxylase 
HPcrtZ aus Haematococcus pluvialis Flotow NIES-144 unter 
Kontrolle des Promotors pcarRA aus Blakeslea trispora. 
Stromabwarts des Gene der Hydroxylase 1st eine Inverted-Repeat- 

25 Struktur lokalisiert, die aus dem 3'-Ende von carA und der 

stromabwarts von carA gelegenen Region stammt (IR, SEQ ID NO: 
74, inverted Repeat V ca. 350 bp von carA, dann ca. 200 bp .Loop' 
und anschlieJiend ca. 350 bp .Inverted Repeat 2') (Seq. pBinAHyg- 
BTpcarRA-HPcrtZ-TAG-3'carA-lR, SEQ ID NO: 40, Fig. 8); 
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p-carRA-HPcrtZ-GCG-3'carA-lR, enthaltend Gen der Hydroxylase 
HPcrtZ aus Haematococcus pluvialis Flotow NIES-144 unter 
Kontrolle des Promotors pcarRA aus Blakeslea trispora. Das Gen 
der Hydroxylase ist mit einer fnverted-Repeat-Struktur fusioniert, 
5 die aus dem 3'-Ende von carA und der stromabwarts von carA 

gelegenen Region stammt (IR, SEQ ID NO; 74, .inverted Repeat V 
ca. 350 bp von carA, dann ca. 200 bp .Loop' und anschliefcend ca. 
350 bp .Inverted Repeat 2'). Das abgeleitete Fusionsprotein besteht 
folgiich aus der Hydroxylase von Haematococcus pluvialis und dem 
10 Carboxyterminus von CarA aus Blakeslea trispora (Seq. pBinAHyg- 

BTpcarRA-HPcrtZ-GCG-3'carA-IR, SEQ ID NO: 41, Fig. 9); 

p-tef1-EUcrtZ, enthaltend Gen der Hydroxylase EUcrtZ (SEQ ID 
NO: 71) aus Erwinia uredova 20D3 (Accession No. D90087) unter 
Kontrolle des ptefl Promotors (Seq. pBinAHygBTpTEFI -EUcrtZ, 
15 SEQ ID NO: 42, Fig. 10); 

p-carRA-EUcrtZ, enthaltend Gen der Hydroxylase EUcrtZ aus 
Erwinia uredova 20D3 unter Kontrolle des Promotors pcarRA aus 
Blakeslea trispora (Seq. pBinAHygBTpcarRA-EUcrtZ, SEQ ID NO: 

43, Fig. 11); 

20 - p-carB-EUcrtZ, enthaltend Gen der Hydroxylase EUcrtZ aus 
Erwinia uredova 20D3 unter Kontrolle des Promotors pcarB aus 
Blakeslea trispora (Seq. pBinAHygBTpcarB-EUcrtZ, SEQ ID NO: 

44, Fig. 12); 

p-gpdA-HPcrtZ-t-crtZ, enthaltend Gen der Hydroxylase HPcrtZ aus 
25 Haematococcus pluvialis Flotow NIES-144 unter Kontrolle des 

gpdA Promotors und des Terminators t-crtZ; d.h. des stromabwarts 
von crtZ aus Haematococcus pluvialis Flotow NIES-144 gelegenen 
Sequenzabschnitts (SEQ ID NO: 73) (Seq. pBinAHyg-gpdA-HPcrtZ- 
tcrtZ, SEQ ID NO: 45, Fig. 13). 
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p-gpdA-BTcarR-HPcrtZ-BTcarA, enthaltend Genfusion aus Genen 
der Lycopincyciase carR aus Biakeslea trispora, der Hydroxylase 
HPcrtZ aus Haematococcus pluvialis Fiotow NIES-144 und der 
Phytoensynthase carA aus Biakeslea trispora unter Kontrolle des 
5 gpdA Promoters aus Aspergillus nidulans {Seq. pBinAHyg- 

carRcrtZcarA, SEQ ID NO; 46, Fig. 14); 

Herstellung gentechnisch veranderter Stamme von Biakeslea 
trispora zur Herstellung von Canthaxanthin 

10 Folgende Plasmide (Abkommlinge von pBinAHyg) wurden zur 
gentechnischen Veranderung von Biakeslea trispora fur die Herstellung 
von Canthaxanthin verwendet, codieren also u.a. Ketolasen (crtW): 

p-tef1-NPcrtW, enthaltend das Gen der Ketolase NPcrtW (SEQ ID 
NO: 72) aus Nostoc punctiforme PCC73102 (ORF148, Accesion 
15 No. NZ_AABC01000196) unter Kontroiie des ptefl Promotors aus 

Biakeslea trispora (Seq. pBinAHygBTpTEF 1 -N pucrtW, SEQ ID NO: 
47, Fig. 15); 

p-carRA-NPcrtW, enthaltend das Gen der Ketolase NPcrtW aus 
Nostoc punctiforme PCC73102 unter der Kontrolle des Promotors 
20 pcarRA aus Biakeslea trispora (Seq. pBinAHygBTpcarRA-NpucrtW, 

SEQ ID NO: 48, Fig. 16); 

p-carB-NPcrtW, enthaltend das Gen der Ketolase NPcrtW aus 
Nostoc punctiforme PCC73102 unter der Kontrolle des Promotors 
pcarB aus Biakeslea trispora (Seq. pBinAHygBTpcarB-NpucrtW, 
25 SEQ ID NO: 49, Fig. 17); 

Herstellung gentechnisch veranderter Stamme von Biakeslea 
trispora zur Herstellung von Astaxanthin 

Folgende Plasmide (Abkommlinge von pBinAHyg) wurden zur 
30 gentechnischen Veranderung von Biakeslea trispora fur die Herstellung 
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von Astaxanthin verwendet, codieren also u.a. fur Hydroxyiasen (crtZ) und 
Ketolasen (crtW): 

p-carRA-HPcrtZ-pcarRA-NPcrtW, enthaltend das Gen der 
Hydroxylase HPcrtZ aus Haematococcus pluvialis Flotow NIES-144 

5 und das Gen der Ketolase NPcrtW aus Nostoc punctiforme 

PCC73102 (ORF148, Accesion No. NZ_AABC01000196) beide 
jeweils unter Kontrolle des Promotors pcarRA aus Blakeslea 
trispora (Seq. pBinAHygBTpcarRA-HPcrtZ-BTpcarRA-NpucrtW, 
SEQ ID NO: 50, Fig. 18); 

10 - p-carRA-EUcrtZ-pcarRA-NPcrtW, enthaltend das Gen der 
Hydroxylase EUcrtZ aus Erwinia uredova20D3 (Accession No. 
D90087) und das Gen der Ketolase NPcrtW aus Nostoc 
punctiforme PCC73102 beide jeweils unter Kontrolie des Promotors 
pcarRA aus Blakeslea trispora (Seq. pBinAHygBTpcarRA-EUcrtZ- 

15 BTpcarRA-NpucrtW, SEQ ID NO: 51, Fig. 19); 

Klonierung und Sequenzanalyse von Genen und Promotoren, die 
beispielhaft fur die gentechnische Veranderung von Blakeslea 
trispora genutzt werden konnen. 

20 Nachfolgend werden beispielhaft die Klonierung und Sequenzierung 

verschiedener Gene und Promotoren aus Blakeslea trispora beschrieben. 

Klonierung und Sequenzanalyse ptefl 

Die Klonierung von p-tef aus Blakeslea trispora erfolgte auf der Grundlage 
25 einer bereits in GenBank veroffentlichten Sequenz des Strukturgens fDr 
den Translations-Elongationsfaktor 1-a aus Blakeslea trispora 
(AF1 57235). Ausgehend von dem Sequenzeintrag AF1 57235 wurden 
Primer fDr die inverse PCR ausgew^hlt, um die stromaufwarts des 
Strukturgens geiegene Promotoregion zu ampiifizieren und zu 
30 sequenzieren. 
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In der inversen nested PCR an 200 ng Xhol-gespaltener und 
zirkularisierter genomischer DNA von Biakeslea trispora ATCC 14272 
wurde ein 3000-bp-Fragment in folgendem Ansatzerhalten: Matrizen-DNA 
(1 ug genomische DNA von Biakeslea trispora ATCC 14272) Primer 

5 MAT344 S'-GGCGTACTTGAAGGAACCCTTACCG-S' (SEQ ID NO: 63) 
und MAT 345 5'-ATTGATGCTCCCGGTCACCGTGATT-3' (SEQ ID NO: 
64) je 0,25 uM, 100 uM dNTP, 10 jj! Herculase-Polymerasepuffer 10x, 5 U 
Herculase (Zugabe bei 85 °C), H 2 0 ad 100 ul. Das PCR-Profii war 95 °C, 
10 min (1 Zykius); 85 °C, 5 min (1 Zyklus); 60 °C, 30 s. 72 e C, 60 s, 95 °C, 

10 30 s (30 Zykien); 72 °C, 10 min (1 Zyklus). Der Sequenzabschnitt, der 
stromaufwarts des vermutlichen Startcodons des Gens tefl innerhalb 
3000-bp-Fragmentes liegt, wurde als Promotor ptefl bezeichnet. 

Klonierung Sequenzanalyse des Gens der HMG-CoA-Reduktase aus 
15 Biakeslea trispora 

Zunachst wurde mit dem Cosmidvektor pANsCosI eine Genbank von 
Biakeslea trispora ATCC 14272, Mating Type (-) hergestellt. Der Vektor 
wurde durch Spaltung mit Xbal linearisiert und anschiieftend 
dephosphoryliert. Eine weitere Spaltung mit mit BamH! schuf die 
20 Insertionsstelie, in welche die mit Sau3AI partieli gespaitene und 
dephosphorylierte genomische DNA von Biakeslea trispora ligiert wurde. 
Die derail gebildeten Cosmide wurden anschlieliend in vitro verpackt und 
in Escherichia coii ubertragen. 

Auf der Grundlage der bekannten Sequenz eines Fragmentes des HMG- 
25 CoA-Reduktase codierenden Gens aus Biakeslea trispora (Eur. J. 
Biochem 220, 403-408 (1994)) wurde eine 315-bp-DNA-Sonde durch 
folgende PCR hergestellt. Reaktionsansatz: 1 ug genomische DNA von 
Biakesiea trispora ATCC 14272, Primer MAT314 5- 
CCGATGGCGACGACGGAAGGTTGTT-3' [SEQ ID NO 79] und MAT315 
30 5'-CATGTTCATGCCCATTGCATCACCT-3' [SEQ ID NO 80] je 0,25 |jM, 
100 uM dNTP, 10 pi Herculase-Polymerasepuffer 10x, 5 U Herculase 
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(Zugabe bei 85 °C), H 2 0 ad 100 pi. Das PCR-Profil war 95 °C, 10 min (1 
Zyklus); 85 °C, 5 min (1 Zyklus); 58 °C, 30 s. 72 °C, 30 s, 95 °C. 30 s (30 
Zyklen); 72 °C, 10 min (1 Zyklus). 

Mit dieser DNA-Sonde wurde die Cosmid-Genbank durchmustert. Es 
5 wurde ein Klon identifiziert, dessen Cosmid mit der DNA-Sonde 
hybridisierte. Die Insertion dieses Cosmids wurde sequenziert Die DNA 
Sequenz enthielt einen Abschnitt, der dem Gen einer HMG-CoA- 
Reduktase zugeordnet wurde [SEQ ID NO 75]. 

10 Klonierung und Sequenzanalyse carB 

(carB = Gen der Phytoendesaturase aus Blakesiea trispora) 
Aus dem Sequenzvergleich der Peptidsequenzen von 
Phytoendesaturasen und dem Vergieich der zugehorigen DNA- 
Sequenzen von Phycomyces blakesleeanus, Cercospora nicotianae, 

15 Phaffia rhodozyma und Neurospora crassa wurden die degenerierten 
Primer MAT182 5'-GCNGARGGNATHTGGTA-3' (SEQ ID 52) und 
MAT192 5'-TCN GCN AGRAADATRTTRTG-3 (SEQ ID 53) abgeleitet. Die 
PCR wurde in 100 pi Ansatzen durchgefuhrt. Diese enthielten 200 ng 
genomische DNA von Blakesiea trispora ATCC14272, 1 pM MAT182, 1 

20 pM MAT192, 100 pM dNTP, 10 pi Pfu-Polymerasepuffer 10x, 2,5 U Pfu- 
Polymeraso (Zugabe bei 85 °C), H 2 0 ad 100 pi. 

Das PCR-Profil war 95 °C, 10 min (1 Zyklus); 85 °C, 5 min (1 Zyklus); 40 
•C, 30 s, 72 °C, 30 s, 95 °C, 30 s (35 Zyklen); 72 °C, 10 min (1 Zyklus). 

25 

Hiermit wurde ein 358-bp-Fragment erhalten, dessen abgeleitete 
Peptidsequenz Ahniichkeit zu den Sequenzen der Phytoendesaturasen 
aufwies. Durch die Methode der inversen PCR (Innis et al. in PCR 
protocols: a guide to methods and applications. 1990. S. 219-227) wurden 
30 nach dem Prinzip des Chromosome-Walking die Genregionen 
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stromaufwarts und stromabwarts des 350-bp-Fragmentes folgenderma&en 
ampiifiziert, kloniert und sequenziert: 

(i) ein 1,1-kbp-Fragment durch PCR mit den Primern MAT219 5- 
AAGTGACACCGGTTACACGCTTGTCTT-3' (SEQ ID 54) und MAT 

5 220 S'-GCTTATCACCATCTGTTACCTCCTTGC-S' (SEQ ID 55) 

erhalten aus 200 ng EcoRI-gespaltener und zirkularisierler 
genomischer DNA von Biakeslea trispora ATCC14272, 0,25 pM 
MAT219, 0,25 pM MAT220, 100 pM dNTP, 10 pi Herculase- 
Poiymerasepuffer 10x, 5 U Herculase (Zugabe bei 85 °C), H 2 0 ad 

10 100 pi. Das PCR-Profil war 95 °C, 10 min (1 Zyklus); 85 °C, 5 min 

(1 Zyklus); 60 °C, 30 s. 72 °C, 60 s, 95 °C, 30 s (30 Zyklen); 72 °C, 
10 min (1 Zyklus), 

(ii) ein 2,9-kbp-Fragment durch PCR mit den Primern MAT219 und 
MAT220 erhalten aus 200 ng Xbal-gespaltener und zirkularisierter 

15 genomischer DNA von Biakeslea trispora ATCC 14272, 0,25 uM 

MAT219, 0,25 pM MAT220, 100 pM dNTP, 10 pi Herculase- 
Polymerasepuffer 10x, 5 U Herculase (Zugabe bei 85 °C), H 2 0 ad 
100 pi. Das PCR-Profil war 95 °C, 10 min (1 Zyklus); 85 °C, 5 min 
(1 Zyklus); 60 °C, 30 s, 72 °C, 3 min, 95 °C, 30 s (30 Zyklen); 72 °C, 
20 10 min (1 Zyklus); 

Der klonierte Sequenzabschnitt ist schematisch in Fig. 20 [SEQ ID NO 77] 
dargestellt. Die Sequenzierung erfolgte in Strang- und 
Gegenstrangrichtung mit den klonierten Fragmenten sowie mit den PCR- 
Produkten. Die Sequenz des klonierten Sequenzabschnitts ist in Fig. 21 
25 [SEQ ID NO 78] gezeigt. 

Sequenzvergleiche 

Die Nukieotidsequenz von carB und die Peptidsequenz des abgeleiteten 
Proteins CarB wurden mit den bekannten Sequenzen verwandter Proteine 
30 vergiichen. Zum Sequenzvergleich wurden die Programme GAP und 
BESTFIT eingesetzt. 
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CarB - Identische Aminoacylreste nach GAP 

Programmeinstellungen: 
Gap Weight: 8 
5 Length Weight: 2 
Average Match: 2.912 
Average Mismatch: -2.003 

Dabei wurde folgende Wertefurdie Obereinstimmung der Aminosauren zu 
CarB aus Blakesiea trispora ATCC14272 in % gefunden: 
10 Phycomyces blakesleeanus: 72,491 
Phaffia rhodozyma: 50,460 
Neurospora crassa: 47,943 
Cercospora nicotianae: 47,740 

15 

CarB -Identische Aminoacylreste nach BESTFIT 

Programmeinstellungen: 
Gap Weight: 8 
Length Weight: 2 
20 Average Match: 2.912 
Average Mismatch: -2.003 

Dabei wurde folgende Werte fOr die Obereinstimmung der Aminosauren zu 
CarB aus Blakesiea trispora ATCC14272 in % gefunden: 
Phycomyces blakesleeanus: 73,380 
25 Phaffia rhodozyma: 53,175 
Neurospora crassa: 51,896 
Cercospora nicotianae: 50,791 

carB - Identische Basen nach GAP 

30 Programmeinstellungen: 
Gap Weight: 50 
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Length Weight: 3 
Average Match: 10.000 
Average Mismatch: 0.000 

Dabei wurde foigende Werte fur die Obereinstimmung der Basen zu CarB 
5 aus Biakeslea trispora ATCC14272 in % gefunden: 
Phycomyces blakesleeanus: 64,853 
Cercospora nicotianae: 50,143 
Phaffia rhodozyma: 43,179 
Neurospora crassa: 42,130 

10 

carB -Identische Basen nach BESTFIT 

Programmeinstellungen: 
Gap Weight: 50 
Length Weight: 3 
15 Average Match: 10.000 
Average Mismatch: -9.000 

Dabei wurde foigende Werte fur die Obereinstimmung der Basen zu CarB 
aus Biakeslea trispora ATCC14272 in % gefunden: 
Phycomyces blakesleeanus: 68,926 
20 Phaffia rhodozyma: 62,403 
Neurospora crassa: 60,230 
Cercospora nicotianae: 56,884 

Klonierung zur Expression von carB 

25 Zur Klonierung und Expression von carB aus Biakeslea trispora wurden 
von dem oben beschriebenen klonierten Sequenzabschnitt aus Biakeslea 
trispora in sechs Leserastern die mdglichen Proteinsequenzen abgeleitet. 
Diese Proteinsequenzen wurden mit den Sequenzen der 
Phytoendesaturasen aus Phycomyces blakesleeanus, Phaffia rhodozyma, 

30 Neurospora crassa, Cercospora nicotianae vergiichen. Auf der Grundlage 
des Sequenzvergleiches wurden im klonierten Sequenzabschnitt der 
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genomischen DNA von Blakeslea trispora drei Exons identifiziert, die 
zusammengefugt eine codierende Region ergeben, deren abgeteitetes 
Genprodukt uber die gesamte Lange 72,7% identische Aminoacyireste mit 
der Phytoendesaturase CarB aus Phycomyces blakesieeanus aufweist. 

5 Dieser Sequenzabschnitt aus drei m5glichen Exons und zwei mdglichen 
Irttrons wurde daher als Gen carB bezeichnet. Zur OberprQfung der 
vorhergesagten Genstruktur wurde die codierende Sequenz von carB aus 
Blakeslea trispora durch PCR mit cDNA von Blakesiea trispora ais Matrize 
und mit den Primern Boil 425 5'- 

10 AGAGAGGGATCCTTAAATGCGAATATCGTTGC-3' (SEQ ID 56) und 
BoI1426 5'-AGAGAGGGATCCATGTCTGATCAAAAGAAGCA-3' (SEQ ID 
57) erzeugt. Das erhaltene DNA-Fragment wurde sequenziert Die 
Lokaiisation von Exons und Introns wurde durch Vergleich der cDNA mit 
der genomischen DNA von carB bestatigt. In Fig. 21 ist die codierende 

15 Sequenz von carB schematisch dargestellt. Zur Expression von carB in 
Escherichia coii wurde zunachst die Ndel-Schnittsteiie in carB durch die 
Methode overlap extension PCR entfemt sowie am 5'-Ende des Gens eine 
Ndel-Schnittstelle und am 3-Ende eine BamHI-Schnittstelle eingefugt. 
Das erhaltene DNA-Fragment wurde mit dem Vektor pJOE2702 ligiert. 

20 Das erhaltene Ptasmid wurde ais pBT4 bezeichnet und zusammen mit 
pCAR-AE in Escherichia coii XL1-Blue kfoniert. Die Expression erfolgte 
durch Induktion mit Rhamnose. Der Nachweis der Enzymaktivitat erfolgte 
durch Nachweis der Lycopinsynthese via HPLC. Die Klonierungsschritte 
sind im foigenden beschrieben: 

25 PCR 1.1: 

Ca. 0,5 ug cDNA von Biakeslea trispora, 0,25 uM MAT350 5*- 
ACTTTATTGGATCCTTAAATGCGAATATCGTTGCTGC-3' (SEQ ID 58), 
0,25 pM MAT244 5'- 

GTTCCAATTGGCCACATGAAGAGTAAGACAGGAAACAG-3' (SEQ ID 
30 59), 100 pM dNTP, 10 pi Pfu-Polymerase-Puffer (lOx), 2,5 U Pfu- 
Polymerase (Zugabe bei 85 °C, "hot start 8 ) und H 2 0 ad 100pL. 
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Temperaturprofii: 

1, 95 °C 10 min, 2. 85 °C 5 min, 3. 40 °C 30s, 4. 72 °C 1 min 30 s, 5. 95 
°C 30 s, 6. 50 °C 30 s, 7. 72 °C 1 min 30 s, 8. 95 °C 30 s, 9. 72 °C 10min 
Zyklen: (1-2.) 1x, (3-5.) 5x, (6-8.) 25x, (9.) 1x 

5 

PCR1.2: 

Ca. 0,5 pg cDNA von Blakeslea trispora, 0,25 pM MAT243 5'- 
CCTGTCTTACTCTTCATGTGGCCAATTGGAACCAACAC-3' (SEQ ID 

60) , 0,25 pM MAT353 5'- 
10 CTATTTTAATCATATGTCTGATCAAAAGAAGCATATTG-3* (SEQ ID 61), 

100 pM dNTP, 10 pi Pfu-Polymerase-Puffer (lOx), 2,5 U Pfu-Polymerase 

(Zugabe bei 85 °C, "hot start") und H 2 0 ad 100 pL. 

Temperaturprofii: 

1. 95 °C 10 min, 2. 85 °C 5 min, 3. 40 °C 30s, 4. 72 °C 1 min 30 s, 5. 95 
15 °C 30 s, 6. 50 °C 30 s, 7. 72 °C 1 min 30 s, 8. 95 °C 30s, 9. 72 °C 10min 
Zyklen: (1 -2.) 1x, (3-5.) 5x, (6-8.) 25x, (9.) 1x 

Reinigung der PCR-Fragmente aus PCR 1.1, 1.2 

Dazu wurde PCR 2 zur Hersteltung der codierenden Sequenz von carB 
20 aus Blakeslea trispora fur die Klonierung in pJOE2702 durchgefuhrt: 

Ca. 50 ng Produkt aus PCR 1-1 und ca. 50 ng Produkt aus PCR1.2 mit 

0. 25 pM MAT350 (5'- 
ACTTTATTGGATCCTTAAATGCGAATATCGTTGCTGC-3' SEQ ID NO 
58), 0,25 pM MAT353 (5'- 

25 CTATTTTAATCATATGTCTGATCAAAAGAAGCATATTG-3' SEQ ID NO 

61) , 100 pM dNTP, 10 pL Pfu-Polymerase-Puffer (lOx), 2,5 U Pfu- 
Polymerase (Zugabe bei 85 °C, "hot start") und H 2 0 ad 100 pL. 
Temperaturprofii: 

1. 95°C 10 min, 2. 85 D C 5 min, 3. 59 °C 30 S, 4. 72 D C 2 min, 5. 95 U C 30 
30 s, 6.72°C 10 min 

Zyklen: (1-2.) 1x, (3-5.) 22x, (6.) 1x 
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AnschlieRend erfolgte eine Reinigung des erhaltenen Fragmentes (~ 1,7 
kbp), ©in© Ligation in Vektor pPCR-Script-Amp, ein© Kionierung in 
Escherichia coli XL1-Biue, Sequenzierung der Insertion, Spaltung mif Ndel 
und BamHI sowie eine Ligation in pJOE2702. Das erhaltene Plasmid 
5 wurde als pBT4 bezeichnet. 

Charakterisierung und Nachweis der Enzymaktivitat von CarB 
(Phytoendesaturase) 

Das von carB abgeieitete Genprodukt wurde als CarB bezeichnet. CarB 
10 weist auf Grundlage der Peptidsequenzanaiyse folgende Eigenschaften 
auf: 

Lange: 582 Aminoacylreste 

Molekulare Masse: 66470 
Isoelektrische Punkt: 6,7 
15 Katalytische Aktivitat: Phytoendesaturase 

Edukt: Phytoen 
Produkt: Lycopin 
EC-Nummer: EC 1.14.99- 

Der Nachweis der Enzymaktivitat erfolgte in vivo. Wenn das Plasmid 
20 (pCAR-AE) in Escherichia coii XL1-Blue ubertragen wird, entsteht der 
Stamm Escherichia coli XL1-Blue (pCAR-AE). Dieser Stamm synthetisiert 
Phytoen. Wenn zusatzlich das Plasmid pBT4 in Escherichia coli XL1-Biue 
ubertragen wird, entsteht der Stamm Escherichia coli XL1-Blue (pCAR- 
AE)(pBT4). Da ausgehend von carB eine enzymatisch aktive 
25 Phytoendesaturase gebildet wird, pruduziert dieser Starnm Lycopin. 



Die Plasmide pCAR-AE und pBT4 wurden daher in Escherichia coli 
ubertragen. Nach Wachstum in Fiussigkultur wurden die Carotinoide aus 
den Zellen extrahiert und charakterisiert (vgl. oben). 
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Durch HPLC Analyse wurde nachgewiesen, daft der Stamm Escherichia 
coli XL1-Biue (pCAR-AE) Phytoen und der Stamm Escherichia coli XL1- 
Blue (pCAR-AE)(pBT4) Lycopin produziert. CarB weist fotglich die 
Enzymaktivitat einer Phytoendesaturase auf. 

5 

Herstellung gentechnisch veranderter Stamme von Blakeslea 
trispora zur Herstellung von Phytoen 

Nachfolgend werden beispielhaft die Herstellung von gentechnisch 
veranderten Organismen zur Herstellung von Phytoen beschrieben. 

10 

Vector pBinAHygAcarB zur Erzeugung von carB" -Mutanten von 
Blakeslea trispora 

FOr die Deletion von carB in Blakeslea trispora wurde der Vektor 
pBinAHygAcarB (SEQ. ID. NO:62, Fig. 22) konstruiert. Der Vorlaufer von 
15 pBinAHygAcarB ist pBinAHyg (SEQ. ID. NO:3, Fig. 2). pBinAHyg wurde 
folgendermafcen konstruiert: 

Aus dem Plasmid pANsCosI (SEQ. ID. NO:4, Fig. 1, Osiewacz, 1994, 
Curr. Genet. 26:87-90) wurde die gpdA-hph Kassette als Bglll/Hindll! 
Fragment isoliert und in das BamHI/Hindlll geoffnete binare Plasmid 

20 pBin19 (Bevan, 1984, Nucleic Acids Res. 12:8711-8721) ligiert. Der so 
erhaltene Vektor wurde als pBinAHyg bezeichnet und enthalt das E. coli 
Hygromycin-Resistenzgen (hph) unter Kontrolle des gpd Promotors und 
des trpC Terrminators aus Aspergillus nidulans sowie die entsprechenden 
Bordersequenzen, die fur den DNA-Transfer von Agrobacterium 

25 notwendig sind. 

Die Amplication der codierenden Sequenz von carB mit den Primern 
MAT350 und MAT353 mittels PCR wurde mit den folgenden Parametern 
durchgefuhrt: 

30 50 ng pBT4 mit 0,25 pM MAT350 (5'-ACTTTATTGGATCCTTAAAT- 
GCGAATATCGTTGCTGC-3'; SEQ ID NO 58), 0,25 uM MAT353 {5*- 
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CTATTTTAATCATATGTCTGATCAAAAGAAGCATATTG-3 , ; SEQ ID NO 
61), 100 pM dNTP, 10 pL Pfu-Polymerase-Puffer, 2,5 U Pfu-Polymerase 
(Zugabe bei 85 "C, "hot start") und ad 100 jjL H 2 0 
Temperaturprofil: 

5 1. 95 °C 10 min, 2. 85 °C 5 min, 3. 58 °C 30s, 4. 72°C 2 min, 5. 95 °C 30s, 
6. 72 °C 10 min. 

Zykien: (1.-2.) 1x, (3-5.) 30x, (6.) 1x 

AnschlieBend erfolgte eine Reinigung des erhaltenen Fragmentes (~ 1,7 
10 kbp), eine Spallung mit Hindlll, eine weitere Reinigung des 364-bp-HindIIi- 
Fragments-carB, gefolgt von einer Spaltung von pBinAHyg mit Hindlll, eine 
Ligation von 364-bp-Hindlll-Fragments-carB in pBinAHyg, eine 
Transformation des Vektors in Escherichia coli und eine Isolierung des 
Konstruktes und Bezeichnung ais pBinAHygAcarB wie oben beschrieben. 
15 Alternativ erfolgte eine partielie Spaltung mit Hindlll und die Klonierung 
eines grofieren Hindill-Fragmentes aus carB in pBinAHyg zur Hersteilung 
von pBinAHygAcarB. 

Erzeugung von carB" -Mutanten von Blakeslea trispora 

20 Zunachst wurde das Plasmid pBinAHygAcarB in den Agrobakterienstamm 
LBA 4404 ubertragen, z. B. durch Elektroporation (vgl. oben). 
AnscnlieRend wurde das Plasmid von Agrobacterium tumefaciens LBA 
4404 in Blakeslea trispora ATCC 14272 und in Blakeslea trispora ATCC 
14271 ubertragen (vgl. oben). Der erfolgretche Nachweis des 

25 Gentransfers in Blakesleslea trispora erfolgte Ober Polymerase- 
Kettenreaktion nach folgendem Protokoll: 

Ca. 0,5 ug DNA aus Blakeslea trispora ATCC 14272 carB" bzw. ATCC 
14271 carB" wurden mit 0,25 pM Primer hph forward (5- 
CGATGTAGGAGGGCGTGGATA-3'; SEQ ID NO 5), 0,25 pM Primer hph 
30 reverse (5'-GCTTCTGCGGGCGATTTGTGT-3'; SEQ ID NO 6), 100 pM 
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dNTP, 10 pL Herculase-Polymerase-Puffer, 2,5 U Herculase-DNA- 
Polymerase (Zugabe bei 85 °C, "hot start") und ad 100 pi H 2 0 umgesetzt. 
Temperaturprofil: 

1. 95°C 10 min, 2. 85 °C 5 min, 3, 58 °C 1 min, 4. 72 °C 1 min, 5. 94 °C 1 
5 min, 6.72°C10min. 

Zyklen: (1.-2.) 1x, (3-5.) 30x, (6.) 1x 

Ais Negativkontrolle wurde eine Amplifikation des 
Kanamycinresistenzgens aus Agrobacterium versucht. Dazu wurden 

10 folgende PCR-Bedingungen verwendet: 

Ca. 0,5 pg DNA aus Blakesiea trispora ATCC 14272 carB" bzw. ATCC 
14271 carB" wurden mit 0,25 pM Primer nptlll forward (5'- 
TGAGAATATCACCGGAATTG-3'; SEQ ID NO 7), 0,25 uM Primer nptlll 
reverse (AGCTCGACATACTGTTCTTCC-3'; SEQ ID NO 8), 100 pM 

15 dNTP, 10 \il Herculase-Polymerase-Puffer, 2,5 U Herculase-DNA- 
Polymerase (Zugabe bei 85 °C, "hot start") und ad 100 pL H 2 0 umgesetzt 
Temperatu rprofi I : 

1. 95 °C 10 min, 2. 85 °C 5 min, 3. 58 °C 1 min, 4. 72 °C 1 min, 5. 94 °C 1 
min, 6. 72 °C 10min- 
20 Zyklen: (1-2.) 1x, (3-5.) 30x, (6.) 1x 

Produktlon von Carotinoiden und Carotinoidvorstufen mit Blakesiea 
trispora 

25 Zur Produktion der Carotinoide Zeaxanthin, Canthaxanthin, Astaxarrthin 
und Phytoen wurden die entsprechenden gentechnisch veranderten 
Blakesiea trispora (+) und (-) Stamme fermentiert, das produzierte 
Carotinoid mittels HPLC Analyse nachgewiesen und isoliert 
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Das Flussigmedium zur Produktion von Carotinoiden enthielt pro Liter: 19 
g Maismehl, 44 g Sojamehl, 0,55 g KH 2 P0 4 , 0,002 g Thiaminhydochiorid, 
10 % Sonnenbiumenol. Der pH wurde mit KOH auf 7,5 eingestellt. 

5 Zur Herstellung der Carotinoiden wurden Schuttelkolben mit 
Sporensuspenslonen von (+) und (-) Stammen der GVO von Blakeslea 
trispora beimpft. Die Schuttelkolben wurden bei 26 °C mit 250 rpm fur 7 
Tage inkubiert. Aitemativ wurde zu Mischungen der Stamme nach 4 
Tagen Trisporsauren zugegeben und weitere 3 Tage inkubiert. Die 

10 Endkonzentration der Trisporsauren betrug 300 - 400 ug/ml. 

Extraktion und Analytik 
Extraktion: 

1 . Entnahme von 10 ml Kuitursuspension 
15 2. Zentrifugation, 10 min, 5.000 x g 

3. Verwerfen des Oberstandes . 

4. Resuspendierung des Pellets in 1 ml Tetrahydrofuran (THF) durch 
Vortexen 

5. Zentrifugation, 5 min, 5.000 x g 
20 6. Abnahme der THF-Phase 

7. Wiederhoiung der Schritte 4.-6. (2 x) 

8. Vereinigung der THF-Phasen 

9. Zentrifugation der vereinigten THF-Phasen 5 min bei 20.000 x g, 
urn Reste der waRrtgen Phase abzutrennen 

25 

Analytik 

Messung von Phytoen mittels HPLC 

Sauie: ZORBAX Eclipse XDB-C8, 5 urn, 1 50*4,6 mm 

Temperatur: 40 °C 
30 Flufkate: 0,5 ml/min 

lnjektionsvolumen:10 pi 
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Detektion: 

Stoppzeit: 

Nachlaufzeit: 

Maximaldruck: 

Eiuent A: 

Eiuent B: 

Gradient: 



UV 220 nm 
12min 
0 min 
350 bar 

50 mM NaH2P0 4) pH 2,5 mit Perchlorsaure 
Acetonitril 



Zeit [minj 

0 

12 



A[%] 

50 

50 



B [%] Fluft [ml/min] 
50 0,5 
50 0,5 



Als Matrix wurden Extrakte der Fermentationsbruhen verwendet. Vor der 
HPLC wurde jede Probe wird durch ein 0,22 urn Filter fiitriert. Die Proben 
wurden kOhl gehalten und vor Licht geschutzt. Zur Kaiibrierung wurden 
jeweiis 50 - 1000 mg/i eingewogen und in THF gelSst. Als Standard wurde 
Phytoen verwendet, welches unter den gegebenen Bedingungen eine 
Retentionszeit von 7.7 min. aufweist. 



Messung von Lycopin, p-Carotin, Echinenon, Canthaxanthin, 
20 Cryptoxanthin, Zeaxanthin und Astaxanthin mittels HPLC 

Saule: Nucleosil 100-7 C18, 250*4,0 mm (Macherey & Nagel) 

Temperatur: 25 °C 

Flulirate: 1,3 ml/min 

injektionsvolumen:10}jl 

25 Detektion: 450 nm 

Stoppzeit: 15min 

Nachlaufzeit: 2 min 

Maximaldruck: 250 bar 

Eiuent A: 1 0% Aceton, 90% H 2 0 

30 Eiuent B: Aceton 

Gradient: 
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Zeit [min] 


A[%] 


B[%] 


FluB [ml/min] 


0 


30 


70 


1,3 


10 


5 


95 


1,3 


12 


5 


95 


1,3 


13 


30 


70 


1,3 



Als Matrix wurden Extrakte der Fermentationsbruhen verwendet. Vor der 
HPLC wurde jede Probe wird durch ein 0,22 urn Filter fiitriert. Die Proben 
wurden kuhl gehalten und vor Licht geschQtzt. Zur Kalibrierung wurden 
10 jeweils 10 mg eingewogen und in 100 ml THF gelost. Ais Standard wurden 
folgende Carotinoide mit folgenden Retentionszeiten eingesetzt B-Carotin 
(12,5 min), Lycopin (11,7 min), Echinenon (10,9 min), Cryptoxanthin (10,5 
min), Canthaxanthin (8,7 min), Zeaxanthin (7,6 min) und Astaxanthin (6,4 
min) [s. Fig 23]. 

15 

Produktion von Zeaxanthin mit gentechnisch veranderten Stammen 
von Blakesiea trispora 

Nachfolgend wird beispielhaft die Herstellung von Zeaxanthin mit 
gentechnisch veranderten Organismen (GVO) von BiakesSea trispora 
20 beschrieben. 

Durch Agrobakterium-vermittelte Transformation wurde der Vektor 
pBinAHygBTpTEFI-HPcrtZ in Biakeslea trispora Gbertragen (s.o.). Etn 
Hygromycin-resistenter Klon wurde isotiert und auf eine Kartoffei-Glucose- 
Agarpiatte (Merck KGaA, Darmstadt) ubertragen. 

25 Nach drei Tagen Inkubation Uei 26X wurde ausgehend von dleser Platte 
ein Sporensuspension hergesteilt Ein 250-m!-Erlenmeyerkoiben ohne 
Schikanen mit 50 ml Growth-Medium (Maismehl 47 g/l, Sojamehi 23 g/i, 
KH 2 P0 4 0,5 g/l, Thiamin-HCI 2.0 mg/l, pH mit NaOH vor der 
Sterilisation auf 6,2-6,7 eingesteilt) wurde mit 1x1 0 5 Sporen beimpft. 

30 Diese Vorkuitur inkubierte 48 Stunden bei 26 °C und 250 upm. Fur die 
Hauptkultur wurde ein 250-ml-Erlenmeyerkoiben ohne Schikane 
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enthaltend 40 ml Produktionsmedium mil 4 mi der Vorkultur beimpft und 8 
Tage bei 26 °C und 150 upm inkubiert. Das Produktionsmedium enthielt 
Glucose 50 g/f, Casein Acid Hydrolisate 2 g/l, Hefeextrakt 1 g/i, L- 
Asparagin 2 g/l, KH 2 P0 4 1,5 g/I, MgS0 4 x 7 H 2 0 0,5 g/l, Thiamin-HCl 5 
5 mg/i, Span20 10 g/l, Tween 80 1 g/i, Linolsaure 20 g/l, Maisquellwasser 80 
g/i. Nach 72 Stunden erfolgte die Zugabe von Kerosin in einer 
Endkonzentration von 40 g/l Kerosin. 

Nach der Ernte der Kuituren werden die verbliebenen ungefahr 35 mi 
Kultur mit Wasser auf 40 ml aufgefulit. AnschlieRend werden die Zelien im 
10 Hochdruckhomogenisator, Typ Micron Lab 40, Fa. APV Gaulin, 3 x bei 
1500 bar aufgeschlossen. 

Die Suspension mit den aufgescblossenen Zellen wurde mit 35 mi THF 
versetzt und 60 min bei RT im Dunkein bei 250 upm geschutteit. Danach 
wurden 2 g NaCI zugegeben und das Gemisch nochmals geschutteit. Der 
15 Extraktionsansatz wurde dann 10 min bei 5000 x g zentrifugiert. Die 
gefarbte THF-Phase wurde abgenommen, die Zeilmasse war vollstandig 
entfarbt. 

Die THF-Phase wurde am Rotationsverdampfer bei 30 mbar und 30 °C 
auf 1 mi eingeengt und danach nochmais in 1 ml THF aufgenommen. 
20 Nach Zentrifugation 5 min bei 20 000 x g wurde ein Aliquot der oberen 
Phase entnommen und durch HPLC analysiert (Fig. 24, Fig. 23). 



25 
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Patentanspruche 

1 . Verfahren zur Herstellung eines gentechnisch veranderten Organismus 
der Gattung Bfakesiea umfassend 

5 (i) Transformation mindestens einer der Zeilen, 

(ii) ggf. Homokaryotisierung der aus (i) erhaltenen Zeilen, so dass 
ZeHen entstehen, in denen die Kerne in einem oder mehreren 
genetischen Merkmaien alle gieichartig verandert sind und diese 
gentechnische Veranderung zur Auspragung bringen, und 

10 (iii) Selektion und Anzucht der gentechnisch veranderten Zelle oder 
Zeilen. 

2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass es sich 
um Zeilen von Pilzen der Art Blakeslea trispora handelt. 

3. Verfahren nach Anspruch 1 oder 2, dadurch gekennzeichnet, dass in 
15 der Transformation (i) ein Vector oder freie Nukleinsauren verwendet 

werden. 

4. Verfahren nach Anspruch 3, dadurch gekennzeichnet, dass der in 

der Transformation (i) eingesetzte Vector in das Genom mindestens 
einer der Zeilen integriert wird. 

20 5. Verfahren nach Anspruch 4, dadurch gekennzeichnet, dass der in 
der Transformation (i) eingesetzte Vector einen Promotor undfoder 
einen Terminator enthait 

6. Verfahren nach einem der vorhergehenden Anspruche 3 bis 5, 
dadurch gekennzeichnet, dass in der Transformation (t) ein Vector 
25 enthaltend den gpd, pcarB, pcarRA und/oder ptefl Promotor und/oder 
den trpC Terminator eingesetzt wird. 
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7. Verfahren nach einem der vorhergehenden Anspriiche 3 bis 6, 
dadurch gekennzeichnet, dass in der Transformation (i) ein Vector 
enthaltend ein Resistenzgen eingesetzt wird. 

5 8. Verfahren nach Anspruch 7, dadurch gekennzeichnet, dass der in 
der Transformation (i) eingesetzte Vector ein Hygromycin- 
Resistenzgen (hph), insbesondere aus E. coli enthalt. 

9. Verfahren nach einem der vorhergehenden Anspriiche 5 - 8, dadurch 
gekennzeichnet, dass der gpd Promotor die Sequenz SEQ ID NO: 1 

10 aufweist. 

10. Verfahren nach einem der vorhergehenden Anspruche 5 - 8, dadurch 
gekennzeichnet, dass der trpC Terminator die Sequenz SEQ ID NO: 
2 aufweist. 

1 1. Verfahren nach einem der vorhergehenden Anspruche 5 - 8, dadurch 
15 gekennzeichnet, dass der tefl Promotor die Sequenz SEQ ID NO: 35 

aufweist. 

12. Verfahren nach einem der Anspruche 6 bis 11, dadurch 
gekennzeichnet, dass der gpd Promotor und der trpC Terminator aus 
Aspergillus nidulans stammen. 

20 13. Verfahren nach einem Anspruche 3 bis 12, dadurch gekennzeichnet, 
dass der Vector die SEQ ID NO: 3 umfasst. 

14. Verfahren nach einem der vorhergehenden Anspruche, dadurch 
gekennzeichnet, dass die Transformation (i) mittels Agrobakterien, 
Konjugation, Chemikalien, Elektroporation, Beschuss mit DNA- 
25 beladenen Partikeln, Protoplasten oder Mikroinjektion durchgefuhrt 
wird. 
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15. Verfahren nach einem der vorhergehenden AnsprUche, dadurch 
gekennzeichnet, dass in der Homokaryontisierung (ii) ein rnutagenes 
Agens eingesetzt wird. 

16. Verfahren nach Anspruch 15, dadurch gekennzeichrtet, dass als 
5 rnutagenes Agens N-Methyl-N'-nitro-nilrosoguanidin (MNNG), UV- 

Strahlung oder Rontgenstrahlung eingesetzt wird. 

17. Verfahren nach einem der vorhergehenden Anspruche, dadurch 
gekennzeichnet, dass die Selektion durch Markierung und/oder 
Auswahl der einkernigen Zellen erfolgt 

10 1 8. Verfahren nach einem der vorhergehenden Anspruche 1-17, dadurch 
gekennzeichnet, dass in der Selektion 5-Carbon-5-deazariboflavin 
(dart) und Hygromycin (hyg) oder 5-Fluororotat (FOA) und Uracil und 
Hygromycin eingesetzt werden. 

19. Verfahren nach einem der Anspruche 3 bis 18, dadurch 
15 gekennzeichnet, dass der in der Transformation (i) eingesetzte Vector 

genetische informationen zur Herstellung von Carotinoiden oder deren 
Vorstufen enthalt. 

20. Verfahren nach einem der AnsprDche 3 bis 19, dadurch 
gekennzeichnet, dass der in der Transformation (i) eingesetzte Vector 

20 genetische Informationen zur Herstellung von Carotinen oder 
Xanthophyilen enthalt. 

21. Verfahren nach einem der Anspruche 3 bis 20, dadurch 
gekennzeichnet, dass der in der Transformation (i) eingesetzte Vector 
genetische Informationen zur Herstellung von Astaxanthin, Zeaxanthin, 

25 Echinenon. p-Cryptoxanthin, Andonixanthin, Adonirubin, 
Canthaxanthin, 3-Hydroxyechinenon, 3'-Hydroxyechinenon, Lycopin, p- 
Carotin, a-Carofm, Lutein, Bixin, Phytofluen oderPhytoen enthalt. 
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22.Verfahren nach einem der AnsprQche 3 bis 21, dadurch 
gekennzeichnet, dass derm der Transformation (i) eingesetzte Vector 
derail gestaltet 1st, dass die im Vector enthaltene genetische 
Information in das Genom von Blakeslea trispora eingefuhrt wird 

5 23 Verfahren nach einem der Anspruche 3 bis 22, dadurch 
gekennzeichnet, dass der in der Transformation (i) eingesetzte Vector 
genetische Informationen enthalt, die nach Expression sine Ketoiase- 
und/oder Hydroxylase-Aktivitat entfalten. 

24. Verfahren nach Anspruch 23, dadurch gekennzeichnet, dass der in 
10 der Transformation (i) eingesetzte Vector die SEQ ID NO: 70 oder 71 

Oder 76 und/oder 72 umfasst. 

25. Verfahren nach Anspruch 23 oder 24, dadurch gekennzeichnet, dass 
der in der Transformation (i) eingesetzte Vector eine Sequenz aus der 
Gruppe bestehend aus den SEQ ID NO: 37 - 51 aufweist. 

15 26.Verfahren nach einem der Anspruche 3 bis 21, dadurch 
gekennzeichnet, dass der in der Transformation (i) eingesetzte Vector 
derail gestaltet ist, dass die im Vector enthaltene genetische 
Information in derZelle ausgeschaltet wird. 

27. Verfahren nach einem der Anspruche 3 bis 21 oder 25, dadurch 
20 gekennzeichnet, dass durch die Transformation (i) das Gen der 

Phytoendesaturase ausgeschaltet wird. 

28. Verfahren nach Anspruch 27, dadurch gekennzeichnet, dass der in 
der Transformation (i) eingesetzte Vector die SEQ ID NO: 69 umfasst. 

29. Verfahren nach Anspruch 27 oder 28, dadurch gekennzeichnet, dass 
25 der in der Transformation (i) eingesetzte Vector die Sequenz SEQ ID 

NO: 62 aufweist. 
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30. Verfahren nach einem der AnsprQche 3 bis 21, dadurch 
gekennzeichnet, dass durch die Transformation das Gen der 
Lycopincyclase ausgeschaltet wird. 

31. Genetisch verSnderte mehrkernige Zellen der zur Gattung Blakeslea 
5 gehfirenden Pilze, insbesondere Blakeslea trispora erhaltlich nach 

einem der vorhergehenden AnsprOche. 

32. Verwendung der Zeilen nach Anspruch 30 oder eines aus ihnen 
gebildeten Mycels zur Hersteliung von Carotinoiden oder deren 
Vorstufen. 

10 33. Verwendung nach Anspruch 30 oder 31 zur Hersteliung von Carotinen 
oder Xanthophyllen. 

34. Verwendung nach einem der AnsprDche 30 bis 32 zur Hersteliung von 
Astaxanthin, Zeaxanthin, Echinenon, p-Cryptoxanthin, Andonixanthln, 
Adonirubin, Canthaxanthin, 3-Hydroxyechinenon, 3- 

15 Hydroxyechinenon, Lycopin, P-Carotin, ot-Carotin, Lutein, Bixin, 
Phytofluen oder Phytoen. 

35. Promotor mit der Sequenz SEQ ID NO: 1 oder 35 zur Verwendung in 
dem Verfahren nach einem der Anspruche 1 - 29. 

36. Terminator mit der Sequenz SEQ ID NO: 2 zur Verwendung in dem 
20 Verfahren nach einem der AnsprOche 1-29. 

37. Vector umfassend die SEQ ID NO: 3 zur Verwendung in dem 
Verfahren nach einem der Anspruche 1 - 29. 

38. Vector nach Anspruch 36 zur Verwendung. in dem Verfahren nach 
einem der Anspruche 1 - 29 umfassend die SEQ ID NO: 69 und/oder 

25 die SEQ (D NO: 70 oder 71 und/oder 72 oder 76. 
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Fig. 1: Vefctor pANsCosl 
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Fig.2:VektorpBinAHyg 
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Fig. 3: Gels des Ergebnis einer PCR 

Spur: 
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Fig. 8: Plasmid p-carRA-HPcriZ-TAG-3'carA-IR 
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Fig. 10: Plasmid pBinAHygBTpTEFI-EUcrtZ 
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Fig. 11: Plasmid pBinAHygBTpcarRA-EUcrtZ 
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Fig. 12: Plasmid pBinAHygBTpcarB-EUcrtZ 



Not\ (93) 
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Fig. 13; Plasmid p-BinAHyg-gpdA-HPcrtZ 



T-DNA I 
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Fig. 15: Plasmid pBin AHyg-BTpTEF1 -NPcrtW 
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Fig. 16: Piasmid pBinAHyg_BTpcarRA_NPcrtW 
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Fig. 17; Plasmid pBinAHyg-BTpcarB-NPcrtW 
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Fig. 20: carB 
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Fig. 21: CDS von carB 
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Fig. 23: HPLC Standard 



Sequence File s c:v\:HfiC3EM\'2:\SSQOEJJCE\.C^0riM . S 
Method C <FECi " f 3 i)S CAROTIN .M 

iast changed : n : 7l2/2 : O.0S 



"DAD1 A,Slg=«[)720-acf--on (131103 1VPROBED18.D) 



■ «• a; 
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Fig. 24: HPLC 



Sequence .'.file : C : \HECHEMV2 \:5EQUEKCB\ CHRCTBf ■ S 
Method" C:\RPCSHEMV2^THODS\CAROTIM.M 
iast- changed i .11/1B/20Q3 t 
Carotii iolde Hucleosil . 100-7a CIS : 350+4 , Omm 
■' DAD1 A,SlgM50.20Ref=off(1B11O3,1\PROBE030.D) 
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SEQUENCE LISTING 



<1X0> BASF AG 

<120> Verfahren zur gentedhnischen Veranderung von Organismen der 

Gattung Blakeslea, entsprechende Organismen und deren Verwendung 



<170> Patentln version 3.2 

<210> 1 

<211> 2160 

<212> DNA 

<213> Artificial 

<220> 

<223> Promotor 
<400> 1 

cfctfccgacac fcgaaafcacgfc cgagcotgct aogottggaa gcggcgagga geefcogtcH-- 60 

gtcacaacta ccaacatgga gtacgataag ggccagttcc gccagctcat taagagccag 120 

ttcatgggcg ttggcatgat ggccgtcatg catctgtact tcaagtacac caacgctctt 180 

ctgatccagt cgatcatccg ctgaaggcgc tttcgaatct ggttaagatc cacgtcttcg 240 

ggaagccagc gactggtgac ctccagcgtc cctttaaggc tgccaacagc tttctcagcc 300 

agggccagcc caagaccgac aaggcctccc tccagaacgc cgagaagaac tggaggggtg 360 

gtgtcaagga ggagtaagct ccttattgaa gtcggaggac ggagcggtgt caagaggata 420 

tCCfctcgact ctgta.tta.ta gatctetgatga tgaggaetfctg gaggtagcat agctteattt 480 

ggatttgctt tccaggctga gactctagct tggagcafcag agggtccttt ggctttcaat 540 

attctcaagt atctcgagtt tgaacttatt ccctgtgaac cttttattca ccaatgagca 600 
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ttggaatgaa catgaatctg aggactgcaa tcgccatgag gttttcgaaa tacatccgga 660 

tgtcgaaggc ttggggcacc tgcgttggtt gaatttagaa cgtggcacta ttgatcatcc 720 

gatagctctg caaagggcgt tgcacaatgc aagtcaaacg ttgctagcag ttccaggtgg 780 

aatgttatga tgagcattgt attaaatcag gagatatagc • atgatctcta gttagctcac 840 

cacaaaagtc agaoggogta aocaaaagtc acaeaacana affetgtaaga atttccrcrcac 900 

ggctacggaa gacggagaag ccaccttcag tggactcgag taccatttaa ttctatttgt 960 

gtttgatcga gacctaatac agcccctaca acgaccatca aagtcgtata gctaccagtg 1020 

aggaagtgga ctcaaatcga cttcagcaac atctcctgga taaactttaa gcctaaacfca 1080 

tacagaataa gataggtgga gagcttatac cgagctccca aatctgtcca gatcatggtt 1140 

gaccggtgcc tggatcttcc tatagaatca tccttattcg ttgacctagc tgattctgga 1200 

gtgacccaga gggtcatgac ttgagcctaa aatccgccgc ctccaccatt tgtagaaaaa 1260 

tgtgacgaac tcy Ltjetgctc tgt*c»gtga ccggfcgactc ttfccfcggcat gcggagagae 139.0 

ggacggacgc agagagaagg gctgagtaat aagccactgg ccagacagct ctggcggctc 1380 

tgaggtgcag tggatgatta ttaatccggg accggccgcc cctccgcccc gaagtggaaa 1440 

ggctggtgtg cccctcgttg accaagaabc tattgcatca tcggagaata tggagcttca 1500 

tcgaatcacc ggcagtaagc gaaggagaat gtgaagccag gggtgfcatag ccgtcggcga 1560 

aatagcatgc cattaaccta ggtacagaag tccaattgct tccgatctgg taaaagattc 1620 

acgagafcagt accttctccg aagtaggtag agcgagtacc cggcgcgtaa gctccctaat 1680 

tggcccatcc ggcatctgta gggcgcccaa atatcigLgcc tctcctgctt tgcccggtgt 1740 

atgaaaccgg aaaggccgct caggagctgg ccagcggcgc agaccgggaa cacaagctgg 1800 

cagtcgaccc atccggtgct ctgcactcga cctgctgagg tccctcagtc cctggtaggc 1860 
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agctttgccc cgtctgtccg cccggtgtgt cggcggggtt gacaaggtcg ttgcgtcagt 1920 

ccaacatttg ttgccatatt ttcctgctct ccccaccagc tgctcttttc fctttctottt 1980 

cttttcccat cttcagtata ttcatcttcc catccaagaa cctttattfcc ccctaagtaa 2040 

gtactttgct acatccatac tccatccttc ccatccctta ttcctttgaa cctttcagtt 2100 

cgagcttfccc oaettoatog oagettgadt aacagctann nngcttgagc agaaatcacc 2160 



<210> 2 

<211> 774 

<212> DMA 

<213> Artificial 

<220> 

<223> Terminator 



<220> 

<221> itdsc_feature 

<222;> (267).. (2G7) 

<223> is is a, c, g, or t 

<220> 

<221> misc„feature 

<222> (475).. (475) 

<223> n is a, c, g, or t 

<220> 

<221> misc_feature 

<222> (566).. (566) 

<223> n is a, c, g, or t 



<400> 2 

cgatccactt aacgttactg aaatcatcaa 
tggtgtcgat gtcagctccg gagttgagac 
ttcatttgtc caagcagcaa agagtgcctt 



acagcttgac gaa.tctggat afcaagafccgt. 60 
aaatggtgtt caggatctcg ataagatacg 120 
ctagtgattt aatagctcca tgtcaacaag 180 
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aataaaacgc gttttcgggt ttacctcttc cagatacagc fccafcctgcaa tgcafctaatg 240 

cattgactgc aacctagtaa cgccttncag gctccggcga agagaagaat agcttagcag 300 

agctattttc afctttcggga gacgagatca agcagatcaa cggtcgtcaa gagacctacg 360 

agactgagga atccgctctt ggctccacgc gactatatat ttgtctctaa ttgfcacfcttg 420 

aasttg-ctoofc ottctfctaet etgatagott (janhat-.gaaa attdcgtcac caacncctacr 480 

gttcgcaaag ataattgcat gtttcttcct tgaactctca agcctacagg acacacattc 540 

atcgtaggta taaacctcga aatcanttcc tactaagatg gtatacaata gtaaccatgc 600 

atggttgcct agtgaatgct ccgtaacacc caatacgccg gccgaaactt ttttacaact 660 

ctcctatgag tcgtttaccc agaatgcaca ggtacacttg tttagaggta atccttcttt 720 

ctagctagaa gtcctcgtgt actgtgtaag cgcccactcc acatctccac tcga 774 



<210> 3 

^211> 15739 

<212> DKA 

<213> Artificial 

<220> 

<223> Vector 



<220> 

<221> misc...feature 

<222> (347X) . . {3471} 

<223> n is a, c, g, or t 

<220> 

<221> misc_feature 

<222> (3679) ..(3679) 

<223> u is a, c, g, or t 



<220> 
<221> 



misc_feature 
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<222> (3770) .. (3770) 
<223> n is a, c, g, or t 

<400> 3 

gatctttcga cactgaaata cgtcgagcct gctccgcttg gaagcggcga ggagcctcgt 60 

cctgtcacaa ctaccaacat ggagtacgat aagggccagt tccgccagct catfcaagagc 120 

oagttcatgg gcgfctggeat gHtggcngi-.c atgcatctat acttcaagta caccaacgct 180 

cfctctgatcc agtcgatcat ccgctgaagg cgctttcgaa tctggttaag atccacgtct 240 

tcgggaagcc agcgactggt gacctccagc gtccctttaa ggctgccaac agctttctca 300 

gccagggcca gcccaagacc gacaaggcct ccctccagaa cgccgagaag aactggaggg 360 

gtggtgtcaa ggaggagtaa gctccttatt gaagtcggag gacggagcgg tgtcaagagg 420 

atattcttcg actcbgtatt atagataaga tgatgaggaa ttggaggtag catagcttca 480 

tttggatttg ctttccaggc tgagactcta gcttggagca tagagggtcc tttggctttc 540 

aatattctca agtatctcga gtfctgaaetfc attcoctgtg aaccttttat tcaoc.ast-.gs 600 

gcattggaat gaacatgaat ctgaggactg caatcgccat gaggttttcg aaatacatcc 660 

ggatgtcgaa ggcttggggc acctgcgttg gttgaattta gaacgtggca ctattgatca 720 

tccgatagct ctgcaaaggg cgttgcacaa tgcaagtcaa acgttgctag cagttccagg 780 

tggaatgtta tgatgagcat tgtattaaat caggagatat agcatgatct ctagttagct 840 

caccacaaaa gtcagacggc gtaaccaaaa gtcacacaac acaagctgfca aggatttcgg 900 

cacggctacg gaagacggag aagccacctt cagtggactc gagtaccatt taattctatt 960 

tgtgtttgat cgagauutaa Uctceigcaccfc acaacgacca tcaangtogt atagctaooa 1020 

gtgaggaagt ggactcaaat cgacttcagc aacatctcct ggataaactt taagcctaaa 10S0 

ctatacagaa taagataggt ggagagctta taccgagctc ccaaatctgt ccagatcatg 1140 
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gttgaccggt gcctggatct tcctafcagaa tcatccttat tcgttgacct agctgattct 1200 

ggagtgaccc agagggfccat gacttgagcc taaaatccgc cgcctocacc atttgtagaa 1260 

aaatgtgacg aactcgtgag ctctgtacag fcgaccggtga ctctttctgg catgcggaga 1320 

gacggacgga cgcagagaga agggctgagt aataagccac tggccagaca gctctggcgg 1380 

ctctgaggtg cagtggatga ttafcfcaataa gggaccggco gmcr.tegr neagaagtgcr 1440 

aaaggctggt gtgcccctcg ttgaccaaga atctattgca tcatcggaga atatggagct 1500 

tcatcgaatc accggcagta agcgaaggag aatgtgaagc caggggtgta tagccgtcgg 1560 

cgaaatagca tgccattaac cfcaggtacag aagtccaatt gcttccgatc tggtaaaaga 1620 

ttcacgagafc agtaccttct ccgaagtagg tagagcgagt acccggcgcg taagcfcccct 1680 

aattggccca tccggcatct gtagggcgtc caaatatcgt gccfcctcctg ctttgcccgg 1740 

tgtatgaaac cggaaaggcc gctcaggagc tggccagcgg cgcagaccgg gaacacaagc 1800 

tggcagtcga cccdtccggl. gcUctgcacfc cgaccfcgcfcg aggtccctca gtccetggfca 1860 

ggcagctttg ccccgtctgt ccgcccggtg tgtcggcggg gttgacaagg tcgttgcgtc 1920 

agtccaacat ttgttgccat attttcctgc tctccccacc agctgctctt ttcttttctc 1980 

tttcttttcc catcttcagt atattcatct tcccatccaa gaacctttat ttcccctaag 2040 

taagtacttt gctacatcca tactccatcc ttcccatccc ttattccttt gaacctttca 2100 

gttcgagctt tcccacttca tcgcagcttg actaacagct accccgcttg agcagacatc 2160 

accatgcctg aactcaccgc gacgtctgtc gagaagtttc tgatcgaaaa gttcgacagc 2220 

gtctccgacc tgatgcagct ctcggagggc gaagaatctc gtgctttcay ■ cttcgatgta 2200 

ggagggcgtg gatatgtcct gcgggtaaat agctgcgccg atggtttcta caaagatcgt 2340 

tatgtttatc ggcactttgc atcggccgcg ctcccgattc cggaagtgct tgacattggg 2400 
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gaattcagcg agagcctgac ctattgcatc tcccgccgtg cacagggtgt cacgttgcaa 2460 

gacctgcctg aaaccgaact gcccgetgtt ctgcagccgg tcgcggaggc catggabgcg 2520 

atcgctgcgg ccgatcttag ccagacgagc gggttcggcc cattcggacc gcaaggaatc 2580 

ggtcaataca ctacatggcg fcgatttcata tgcgcgattg cfcgatcccca tgtgtatcac 2 640 

tggoaaaotg fccpatg-gacga oaecgtcagt gcgteogtcg egcaggctct evjatgagctg 2700 

atgctttggg ccgaggactg ccccgaagtc cggcacctcg tgcacgcgga tttcggctcc 2760 

aacaatgtcc tgacggacaa tggccgcata acagcggtca ttgactggag cgaggcgatg 2820 

ttcggggatt cccaatacga ggtcgccaac atcttcttct ggaggccgtg gttggcttgt 2880 

atggagcagc agacgcgcta cttcgagcgg aggcatccgg agcttgcagg atcgccgcgg 2940 

ctccgggcgt atatgctccg cattggtott gaccaactct atcagagctt ggttgacggc 3000 

aatttcgatg atgcagcttg ggcgcagggt cgatgcgacg caatcgtccg atccggagcc 3060 

gggautytug ggcgtacaca aatcgcocgc agaagcgcgg ccgtctggac cgafcggctgt 3120 

gtagaagtac tcgccgatag tggaaaccga cgccccagca ctcgtccgag ggcaaaggaa 3180 

tagagtagat gccgaccgcg ggatcgatcc acttaacgtt actgaaatca tcaaacagct 3240 

tgacgaatct ggatataaga tcgttggtgt cgatgtcagc tccggagfctg agacaaatgg 3300 

tgttcaggat ctcgataaga tacgttcatt tgtccaagca gcaaagagtg ccttctagtg 33 60 

atttaatagc tccatgtcaa caagaataaa acgcgttttc gggtttacct cttccagata 3420 

cagctcatct gcaatgcatt aatgcattga ctgcaaccta gtaacgcctt ncaggctccg 3480 

gcgaagagaa gaatagctta gcagagceat tttcattttc gggagacgag eiUuaagwaga 3540 

tcaacggtcg tcaagagacc tacgagactg aggaatccgc tcttggctcc acgcgactat 3600 

atatttgtct ctaattgtac tttgacatgc tcctcttctt tactctgata gcttgactat 3660 
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gaaaattccg tcaccagcnc ctgggttcgc aaagataatt gcatgtttct tccttgaact 3720 

ctcaagccta caggacacac attcatcgta ggtataaacc tcgaaatcan ttcctactaa 3780 

gatggtatac aatagtaacc atgcatggtt gcctagtgaa tgctccgtaa cacccaatac 3840 

gccggccgaa acttttttac aacfcctccta tgagtcgttt acccagaatg cacaggtaca 3900 

efcfr.gtttaga ggtaatcctt ctttctacrct agaagtcctc gtgtacfcgtg taagcgccca 3960 

cfcccacatct ccactcgacc tgcaggcatg caagcttggc gtaatcatgg tcatagctgt 4020 

ttcctgtgtg aaattgttat ccgctcaoaa ttccacacaa catacgagcc ggaagcataa 4080 

agtgtaaagc ctggggtgcc taatgagtga gctaactcac attaattgcg ttgcgctcac 4140 

tgcccgcttt ccagtcggga aacctgtcgt gccagctgca ttaatgaatc ggccaacgcg 4200 

cggggagagg cggtttgcgt attgggccaa agacaaaagg gcgacattca accgatfcgag 4260 

ggagggaagg taaatattga cggaaattat tcattaaagg tgaattatca ccgtcaccga 4320 
ctfcgagocat fctgggaafcta gagoosgraa aatcaccagt agcaccatta ccattagcaa 4380 
ggccggaaac gtcaccaatg aaaccatcga tagcagcacc gtaatcagta gcgacagaat 4440 
caagtttgcc tttagcgtca gactgtagcg cgttttcatc ggcattttcg gtcatagccc 4500 
ccttattagc gfcttgccatc ttttcataat caaaatcacc ggaaccagag ccaccaccgg 4560 
aaccgcctcc ctcagagccg ccaccctcag aaccgccacc ctcagagcca ccaccctcag 4620 
agccgccacc agaaccacca ccagagccgc cgccagcatt gacaggaggc ccgafcctagt 4680 
aacatagatg acaccgcgcg cgataattta tcctagtttg cgcgctatat tttgttttct 4740 
eiUugcgtatt aaatgtataa tfcgcgggaat otaatcataa aaaceeatct Mhaaahaac 4800 
gtcatgcatt acatgttaat tattacatgc ttaacgtaat tcaacagaaa ttatatgata 4860 
atcatcgcaa gaccggcaac aggattcaat cttaagaaac tttattgcca aatgtttgaa 4920 
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cgatcgggga tcatccgggt ctgtggcggg aactccacga aaatatccga acgcagoaag 4980 

atatcgcggt gcatctcggt cttgcctggg cagtcgccgc cgacgccgtt gatgtggacg 5040 

ccgggcccga tcatattgtc gctcaggatc gtggcgttgt gcttgtcggc cgttgctgfcc 5100 

gtaatgatat cggcaccttc gaccgcctgt tccgcagaga tcccgtgggc gaagaactcc 5160 

agoafcgagat nr.cngogfifcg gaggatcafcc cagccggcgt cccggaaaac gattccgaag 5220 

cccaaccttt catagaaggc ggcggtggaa tcgaaatctc gtgatggcag gttgggcgtc 5280 

gcttggfccgg tcatttcgaa ccccagagtc ccgctcagaa gaactcgtca agaaggcgat 5340 

agaaggcgat gcgctgcgaa tcgggagcgg cgataccgta aagcacgagg aagcggtcag 5400 

cccattcgcc gccaagctct tcagcaatat cacgggtagc caacgctatg tcctgatagc 5460 

ggtccgccac acocagccgg ccacagtcga tgaatccaga aaagcggcca ttttccacca 5520 

tgatattcgg caagcaggca tcgccatggg tcacgacgag atcatcgccg tcgggcatgc 5580 

gcgccbfcgag cctggcgaac agfcfccggatg gcgagagooo atgatgatat tcgtcaagat 5640 

catcctgatc gacaagaccg gcttccatcc gagtacgtgc tcgctcgatg cgatgtttcg 5700 

cttggtggtc gaatgggcag gtagccggat caagcgtatg cagccgccgc attgcatcag 5760 

ccatgatgga tacttfcctcg gcaggagcaa ggtgagafcga caggagatcc tgccccggca 5820 

cttcgcccaa tagcagccag tcccttcccg cttcagtgac aacgtcgagc acagctgcgc 5880 

aaggaacgcc cgtcgtggcc agccacgata gccgcgctgc ctcgfccctgc agttcattca 5940 

gggcaccgga caggtcggtc ttgacaaaaa gaaccgggcg ccccfcgcgct gacagccgga 6000 

ctcetcggcggc atcagagcag ccgctttgtct gtfcgtgccca gtcatagccg aatagoctct GOG0 

ccacccaagc ggccggagaa cctgcgfcgca atccatcttg ttcaatcatg cgaaacgatc 6120 

cagatccggt gcagattatt tggattgaga gtgaatatga gactctaatt ggataccgag 6180 
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gggaatttat ggaacgtcag tggagcattt ttgacaagaa atatttgcta gctgatagfcg 6240 

accttaggcg acttttgaac gcgcaataat ggtttctgac gtatgtgctt agctcattaa 6300 

actccagaaa cccgcggctg agtggctcct tcaacgttgc ggttctgtca gttccaaacg 6360 

taaaacggct tgtcccgcgt catcggcggg ggtcataacg tgactccctt aafctctccgc 6420 

tcatgatcag attgtcgttt cccgccttca gtttaaacta tcagtgtttg acaggatata 6480 

ttggcgggta aacctaagag aaaagagcgt ttattagaat aatcggatat ttaaaagggc 6540 

gtgaaaaggt ttatccgttc gtccatttgt atghgcatgc caaccacagg gttccccaga 6600 

tctggcgccg gccagcgaga cgagcaagat tggccgccgc ccgaaacgat ccgacagcgc 6660 

gcccagcaca ggtgcgcagg caaattgcac caacgcatac agcgccagca gaatgccata 6720 

gtgggcggtg acgtcgttcg agtgaaccag atcgcgcagg aggcccggca gcaccggcat 6780 
aatcaggccg atgccgacag cgtcgagcgc gacagtgctc agaattacga tcaggggtat 6840 
gtt . ragfcttc aogfcotggcc tccgQacr.ag cctccgctgg tccgattgaa cgcgcggatt 6900 
ctttatcact gataagttgg tggacatatt atgtttatca gtgataaagt gtcaagcatg 6960 
acaaagttgc agccgaatac agtgatccgt gccgccctgg acctgttgaa cgaggtcggc 7 020 
gfcagacggtc tgacgacacg caaactggcg gaacggttgg gggttcagca gccggcgctt 7080 
tactggcact tcaggaacaa gcgggcgctg ctcgacgcac tggccgaagc catgctggcg 7140 
gagaatcata cgcattcggt gccgagagcc gacgacgact ggcgctcatt tctgatcggg 7200 
aatgcccgca gcttcaggca ggcgctgctc gcctaccgcg atggcgcgcg catccatgcc 7260 
ggcacgcgac cgggcgcacc gcagatggaa aoggocgacg egeagcfchfig cttcctctgc 7320 
gaggcgggtt tttcggccgg ggacgccgtc aatgcgctga tgacaatcag cfcacttcact 7380 
gttggggccg tgcttgagga gcaggccggc gacagcgatg ccggcgagcg cggcggcacc 7440 
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gttgaacagg ctccgctctc gccgctgttg cgggccgcga tagacgcctt cgacgaagcc 7500 

ggtccggacg cagcgttcga gcagggactc gcggtgafctg tcgatggatt ggcgaaaagg 7B60 

aggctcgttg tcaggaacgt tgaaggaccg agaaagggtg acgattgatc aggaccgctg 7620 

ccggagcgca acccactcac tacagcagag ccatgtagac aacatcccct ccccctttcc 7680 

aeogcgtoag acgcccrgt-ag nragnnGgcfca cgggcttttt catgcccfccrc cctagcqtcc 7740 

aagcctcacg gccgcgctcg gcctctctgg cggccttctg gcgctcttcc gcttcctcgc 7800 

tcactgactc gctgcgetcg gtcgttcggc tgcggcgagc ggtatcagct cactcaaagg 7 860 

cggtaatacg gttatccaca gaatcagggg ataacgcagg aaagaacatg tgagcaaaag 7920 

gccagcaaaa ggccaggaac cgtaaaaagg ccgcgttgct ggcgtttttc cataggctcc 7980 

gcccccctga cgagcatcac aaaaatcgac gctcaagtca gaggtggcga aacccgacag 8040 

gactataaag ataccaggcg tttccccctg gaagctccct cgtgcgctct cctgfctccga .8100 

ccctgccgct taocggatao ctgtecgaofc ttatcacttc gggaagcgtg gegettfcfcPR R1.60 

gctgcataac cctgcttcgg ggtcattata gcgatttttt cggtatatcc atccttttto 8220 

gcacgatata caggattttg ccaaagggtt cgtgbagact ttccttggtg tatccaacgg 8280 

cgtcagccgg gcaggatagg tgaagtaggc ccacccgcga gcgggtgttc cttcttcact 8340 

gtcccttatt cgcacctggc ggtgctcaac gggaafccctg ctctgcgagg ctggccggct 8400 

accgccggcg taacagatga gggcaagcgg atggctgatg aaaccaagcc aaccaggaag 8460 

ggcagcccac ctatcaaggt gtactgcctt ccagacgaac gaagagcgat tgaggaaaag 8520 

gcggcggcgg ccggceifcga.g cctgtcggcc fcacctgctgg ccgtcggcca gggctacaaa S5S0 

atcacgggcg tcgtggacta tgagcacgtc cgcgagctgg cccgcatcaa tggcgacctg 8640 

ggccgcctgg gcggcctgct gaaactctgg ctcaccgacg acccgcgcac ggcgcggttc 8700 
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ggtgatgcca cgatcctcgc cctgctggcg aagatcgaag agaagcagga cgagcttggc 8760 

aaggtcatga tgggcgtggt ccgcccgagg gcagagccat gactttttta gccgctaaaa 8820 

cggccggggg gtgcgcgtga ttgccaagca cgtccccatg cgctccatca agaagagcga 8880 

cttcgcggag ctggtgaagt acatcaccga cgagcaaggc aagaccgagc gcctttgcga 8940 

cgctcacogg gctggtfcgoe ptngcpgctg ggnt-.ggfiggc cgtctatggc cctgcaaacg 9000 

cgccagaaac gccgtcgaag ccgtgtgcga gacaccgcgg ccgccggcgt tgtggatacc 9060 

tcgcggaaaa cttggccctc actgacagat gaggggcgga cgttgacact tgaggggccg 9120 

actcacccgg cgcggcgttg acagatgagg ggcaggctcg atttcggccg gcgacgtgga 9180 

gctggccagc ctcgcaaatc ggcgaaaacg cctgatttta cgcgagtttc ccacagatga 9240 

tgtggacaag cctggggata agtgccctgc ggtattgaca cttgaggggc gcgactactg 93 00 

acagatgagg ggcgcgatcc ttgacacttg aggggcagag tgctgacaga tgaggggcgc 9360 

acctatfcgac afcttgagggg cfcgtccacag goagaaaato cagcatttga aagggtttcd 9420 

gcccgttttt cggccaccgc taacctgtct tttaacctgc ttttaaacca atatttataa 9480 

accttgtttt taaccagggc tgcgccctgt gcgcgtgacc gcgcacgccg aaggggggtg 9540 

cccccccttc tcgaaccctc ccggcccgct aacgcgggcc tcccatcccc ccaggggctg 9600 

cgcccctcgg ccgcgaacgg cctcacccca aaaatggcag cgctggcagt ccttgccatt 9660 

gccgggatcg gggcagtaac gggatgggcg atcagcccga gcgcgacgcc cggaagcatt 9720 

gacgtgccgc aggtgctggc atcgacattc agcgaccagg tgccgggcag tgagggcggc 9780 

ggcctgggcg gcggcctgcc cbLcacLtcg gccgtcgggg cattcacgga ctfccatggcg 9 840 

gggccggcaa tttttacctt gggcattctt ggcatagtgg tcgcgggtgc cgtgctcgtg 9900 

ttcgggggtg cgataaaccc agcgaaccat ttgaggtgat aggtaagatt ataccgaggt 99 60 
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atgaaaacga gaattggacc tttacagaat tactctatga agcgccatat ttaaaaagct 10020 
accaagacga agaggabgaa gaggatgagg aggcagattg ccttgaatat attgacaata 10080 
ctgataagat aatatatctt ttatatagaa gatatcgccg tatgtaagga tttcaggggg 10140 
caaggcatag gcagcgcgct tatcaatata tctatagaat gggcaaagca taaaaacttg 10200 
aatgcractaa tgcttgaaac ccaggacaat aaccttatag cttgtaaatt ctatcataat 10260 
tgggtaatga ctccaactta ttgatagtgt tttatgttca gafcaatgccc gatgactttg 10320 
tcatgcagct ccaccgattt tgagaacgac agcgacttcc gtcccagccg tgccaggtgc 10380 
tgcctcagat tcaggttatg ccgctcaatt cgctgcgtat atcgcttgct gattacgtgc 10440 
agctttccct tcaggcggga ttcatacagc ggccagccat ccgtcatcca tatcaccacg 10500 
tcaaagggfcg acageaggct cataagacgc cccagcgfccg ccatagtgcg ttcaccgaat 10560 
acgtgcgcaa caaccgtctt ccggagactg tcatacgcgt aaaacagcca gcgctggcgc 10 620 
gatttagacc ogacatagcc nrsanfcgfcfcca tccatttccg cgcagacgat gacgtcactg 10680 
cccggctgta tgcgcgaggt taccgactgc ggcctgagtt ttttaagtga cgtaaaatcg 10740 
tgttgaggcc aacgcccata atgcgggctg ttgcccggca tccaacgcca ttcatggcca 10800 
tatcaatgat tttctggtgc gtaccgggtt gagaagcggt gtaagtgaac tgcagttgcc 10860 
atgfctttacg gcagtgagag cagagatagc gctgatgtcc ggcggtgctt ttgccgttac 10920 
gcaccacccc gtcagtagct gaacaggagg gacagctgat agacacagaa gccacfcggag 10980 
cacctcaaaa acaccatcat acactaaatc agtaagttgg cagcatcacc cataattgtg 11040 
gtttcaaBBt cggctccgtc gafcaafca.fcgt tatacgceaa efcttrjaaaae aaefcfctgaaa 11100 
aagctgtttt ctggtattta aggttttaga atgcaaggaa cagtgaattg gagttcgtct 11160 
tgttataatt agcttcttgg ggtatcttta aatactgtag aaaagaggaa ggaaataata 11220 
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aatggctaaa atgagaatat caccggaatt gaaaaaactg atcgaaaaat accgctgcgt 11280 

aaaagatacg gaaggaatgt ctcctgctaa ggtatataag ctggtgggag aaaatgaaaa 11340 

cctatattta aaaatgacgg acagccggta taaagggacc acctatgatg tggaacggga 11400 

aaaggacatg atgctatggc tggaaggaaa gctgcctgtt ccaaaggtce tgcactttga 11460 

acggcatgafc ggot-ggagaa atntgctcat gagtgaggcc gatcrgcgtcc tttcrcfccgera 11520 

agagtatgaa gatgaacaaa gccctgaaaa gattatcgag ctgtatgcgg agtgcatcag 11580 

gctctttcac tccatcgaca tatcggafctg tccctatacg aatagcttag acagccgctt 11640 

agccgaattg gattacttac tgaataacga tctggccgat gtggattgcg aaaactggga 11700 

agaagacact acatttaaag atccgcgcga gctgtatgat tttttaaaga cggaaaagcc 117 60 

cgaagaggaa cttgtctttt cccacggcga cctgggagac agcaacatct ttgtgaaaga 11820 

tggcaaagta agtggcttta ttgatcttgg gagaagcggc agggcggaca agtggtatga 11880 

cafctgccttc tgcgfcccggt ogatoaggga ggatafccggg gaagaacagt atgtogagcfc 11940 

attttttgac ttactgggga tcaagcctga ttgggagaaa ataaaatatt atattttact 12000 

ggatgaattg ttttagtacc tagatgtggc gcaacgatgc cggcgacaag caggagcgca 12 060 

ccgacttctt ccgcatcaag tgttttggct ctcaggccga ggcccacggc aagtattfcgg 12120 

gcaaggggtc gctggtattc gtgcagggca agattcggaa taccaagtac gagaaggacg 12180 

gccagacggt ctacgggacc gacttcattg ccgataaggt ggattatctg gacaccaagg 12240 

caccaggcgg gtcaaatcag gaataagggc acattgcccc ggcgtgagtc ggggcaatcc 12300 

cgcaaggayg ytyaatgaat cggacgfcttg accggaaggc atacaggcoa gaactgatcg 123 SO 

acgcggggtt ttccgccgag gatgccgaaa ccatcgcaag ccgcaccgtc atgcgtgcgc 12420 

cccgcgaaac cttccagtcc gtcggctcga tggtccagca agctacggcc aagatcgagc 12480 
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gcgacagcgt geaactggct ccccctgccc tgcccgcgcc atcggccgcc gtggagcgtt 12540 
cgcgtcgtct cgaacaggag gcggcaggtt tggcgaagtc gatgaccatc gacacgcgag 12600 
gaactatgac gaccaagaag cgaaaaaccg ccggcgagga cctggcaaaa caggtcagcg 12 660 
aggccaagca ggccgcgttg ctgaaacaca cgaagcagca gatcaaggaa atgcagcttt 1272 0 
ccttgttcga tattgcgccg tggccggaca cgatgcgagc gatgccaaac gacacggccc 12780 
gctctgccct gttcaccacg cgcaacaaga aaatcccgcg cgaggcgctg caaaacaagg 12840 
tcattttcca cgtcaacaag gacgtgaaga tcacctacac cggcgtcgag ctgcgggccg 12900 
acgatgacga actggbgtgg cagcaggtgt tggagtacgc gaagcgcacc cctatcggcg 12960 
agccgatcac cttcacgttc tacgagcttt gccaggacct gggctggtcg atcaatggcc 13020 
ggtattacac gaaggccgag gaatgcctgt cgcgcctaca ggcgacggcg atgggcttca 13080 
cgtccgaccg cgttgggcac ctggaatcgg tgtcgctgct gcaccgcttc cgcgtcctgg 13140 
accgtggcaa gaaaacgtcc cgttgccagg tcctgatcga cgaggaaatc gtcgtgctgt 13200 
ttgctggcga ccactacacg aaattcatat gggagaagta ccgcaagctg tcgccgacgg 13260 
cccgaeggat gttcgactat ttcagctcgc accgggagcc gtacccgctc aagctggaaa 13320 
ccttccgcct catgtgcgga tcggattcca cccgcgtgaa gaagtggcgc gagcaggtcg 13380 
gcgaagcctg cgaagagttg cgaggcagcg gcctggtgga acacgcctgg gtcaatgatg 13440 
acctggtgca ttgcaaacgc tagggccttg tggggtcagt tccggctggg ggttcagcag 13500 
ccagcgcttt actggcattt caggaacaag cgggcactgc tcgacgcact tgcttcgctc 13560 
agtatogofco gggacgoacg gegegctefcs eg-aactgccg ataaacagag aattaaaatt 13620 
gacaattgtg attaaggctc agattcgacg gcttggagcg gccgacgtgc aggatttccg 13680 
cgagatccga fctgtcggccc tgaagaaagc tccagagatg ttcgggtccg tttacgagca 13740 
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cgaggagaaa aagcccatgg aggcgttcgc bgaacggttg cgagatgccg tggcattcgg 13800 

cgcctacatc gacggcgaga tcattgggct gtcg'gtcttc aaacaggagg acggccccaa 13860 

ggacgctcac aaggcgcatc tgfcccggcgt tttcgtggag cccgaacagc gaggccgagg 13920 

ggtcgccggt atgctgctgc gggcgttgcc ggcgggttta ttgctcgtga tgatcgtccg 139 80 

acagattcoa acgggaatai-- gETfcggahgeg eatcttcatc cfeccrqccrcac ttaatatttc 14040 

gctattctgg agcfctgttgt ttatttcggt ctaccgcctg ccgggcgggg tcgcggcgac 14100 

gghaggcgct gtgcagccgc tgatggtcgt gttcatctct gccgctctgc taggtagccc 14160 

gatacgattg atggcggtcc tgggggctat ttgcggaact gcgggcgtgg cgctgttggt 14220 

gttgacacca aacgcagcgc tagatcctgt cggcgtcgca gcgggcctgg cgggggcggt 14280 

ttccatggcg ttcggaaccg tgctgacccg caagtggcaa cctcccgtgc ctctgctcac 14340 

ctttaccgcc tggcaactgg cggccggagg acttctgctc gttccagtag ctttagbgtt 14400 

fcgatccgcoa atcocgatgc etaoaggaao caatgttcta ggccfcggcgt ggetcggoet 14460 

gafccggagcg ggtttaacct acttcctttg gttccggggg atctcgcgac tcgaacctac 14520 

agttgttfccc ttactgggct ttcfccagccc cagatctggg gtcgatcagc cggggatgca 14580 

tcaggccgac agtcggaact tcgggtcccc gacctgtacc attcggtgag caatggatag 14640 

gggagttgat atcgtcaacg ttcacttcta aagaaatagc gccactcagc ttcctcagcg 14700 

gctttatcca gcgatttcct attatgtcgg catagttctc aagatcgaca gcctgtcacg 14760 

gttaagcgag aaafcgaataa gaaggctgat aattcggatc tctgcgaggg agatgatatt 14820 

tgatcacagg cagcactugct ctgtcatcgt tacaatcaac atgotaccct ccgcgagatc 148 80 

atccgtgttt caaacccggc agcttagttg ccgttcttcc gaatagcatc ggtaacatga 14940 

gcaaagtctg ccgccttaca acggctctcc cgctgacgcc gtcccggact gatgggctgc 15000 
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ctgtatcgag tggtgatttt gtgccgagct gccggtcggg gagctgttgg ctggctggtg 15050 

gcaggatata ttgtggtgta aacaaattga cgcttagaca acfctaataac acattgcgga 15120 

cgtttttaat gtaetggggt .ggtttttctt ttcaccagtg agacgggcaa cagctgattg 15180 

cccttcaccg cctggccctg agagagttgc agcaagcggt ccacgctggt ttgccccagc 15240 

aggdgaaaat cctcrtttgat gghggttcca aaahcggcaa aatcccttat aaatcaaaaa 15300 

aatagcccga gatagggttg agtgttgttc cagtttggaa caagagtcca ctattaaaga 15360 

acgtggactc caacgtcaaa gggcgaaaaa ccgtctatca gggcgatggc ccactacgtg 15420 

aaccatcacc caaatcaagt tttttggggt cgaggtgccg taaagcacta aatcggaacc 15480 

cfcaaagggag cccccgatfct agagcttgac ggggaaagcc ggcgaacgtg gcgagaaagg 15540 

aagggaagaa agcgaaagga gcgggcgcca ttcaggctgc gcaactgfctg ggaagggcga 15600 

tcggtgcggg cctcttcgct attacgccag ctggcgaaag ggggatgtgc tgcaaggcga 15660 

fctaagttggg taacgccagg gttttecoag fccaogacgtt gtaaaacgae ggccagtgaa 1572 0 

ttcgagctcg gtacccggg 15739 

<210> 4 
<211> 11611 
<212> DNA 
<213> Artificial 

<220> 

<223> Vector 
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<221> misc_feature 

<222> (227).. (227) 

<223> n is a, c, g, or t 



<220> 
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<221> niisc_feature 
<222> (318).. (318) 
<223> n is a, c, g, or t 

<220> 

<221> misc_feature 

<222> (526).. (526) 

<223> n is a, c, g, or t 

<220> 

<221> misc_feature 

<222> (8946) .. (8946) 

<223> n is a, c, g, or t 

<22 0> 

<221> misc_feature 

<222> (10028) .. (10028) 

<223> n is a, c, g, or t 

<400> 4 

agcttgcatg cctgcaggtc gagtggagat gtggagtggg cgcttacaca gtacaogagg 60 

aefctetaget agaaagaagg attacctcta aacaagtgta cctgtgcatt ctgggtaaac 120 

gactcatagg agagttgtaa aaaagtttcg gccggcgtat tgggtgttac ggagcattca 180 

ctaggcaacc atgcatggtt actattgtat accatcttag taggaantga tttcgaggtt 240 

tatacctacg atgaatgtgt gtcctgtagg cttgagagtt caaggaagaa acatgcaatt 300 

atctttgcga acccaggngc tggtgacgga attttcatag tcaagctatc agagtaaaga 360 

agaggagcat gtcaaagtac aattagagac aaatatatag tcgcgtggag ccaagagcgg 420 

attcctcagt ctcgtaggtc tcttgacgac cgttgatctg cttgatctcg tctcccgaaa 480 

atgaaaatag ctctget&ag cfcafctettcfc f.ttifsgecgga gcctgnaagg cgttactagg 540 

ttgcagtcaa tgcattaatg cattgcagat gagctgtatc tggaagaggt aaacccgaaa 600 

acgcgfcttta ttcttgttga catggagcta ttaaatcact agaaggcact etttgctgct 660 
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tggacaaatg aacgtatctt atcgagatcc tgaacaccat ttgtctcaac tccggagctg 720 
acatcgacac caacgatctfc atatccagat tcgtcaagct gtttgatgat ttcagtaacg 780 
ttaagtggat cgatcccgcg gtcggcatct acfcctattcc tttgccctcg gacgagtgct 840 
ggggcgtcgg tttccactat cggcgagtac ttctacacag ccatcggtcc agacggccgc 900 

gcttctgcgg gcgattbgtg tacgcccgac agtcccggct ccggatcgga cgattgcgtc 960 

gcatcgaccc tgcgcccaag ctgcatcatc gaaattgccg tcaaccaagc tctgatagag 1020 

LLggtcciaga ccctcttgcygci gcatottcicgc ccggetgccgc ggcgcitcctg cetagctccgg 1080 

atgcctccgc tcgaagtagc gcgtctgctg ctccatacaa gccaaccacg gcctccagaa 1140 

gaagatgttg gcgacctcgt attgggaatc cccgaacatc gcctcgctcc agtcaatgac 1200 

cgctgttatg cggccattgt ccgtcaggac attgttggag ccgaaatccg cgtgcacgag 1250 

gtgccggact tcggggcagt cctcggccca aagcatcagc tcatcgagag cctgcgcgac 1320 

ggacgcactg acggtgtcgt ccatcacagt ttgccagtga tacacatggg gatcagcaat 1380 

cgcgcatatg aaatcacgcc atgtagtgta ttgaccgatt ccttgcggtc cgaatgggcc 1440 

gaacccgctc gtctggctaa gatcggccgc agcgatcgca tccatggcct ccgcgaccgg 1500 

ctgcagaaca gcgggcagtt cggtttcagg caggtcttgc aacgtgacac cctgtgcacg 1560 

gcgggagatg caataggtca ggctctcgct gaattcccca atgtcaagca cttccggaat 1620 

cgggagcgcg gccgatgcaa agtgccgata aacataacga tctttgtaga aaccatcggc 1680 

gcagctattt acccgcagga catatccacg ccctcctaca tcgaagctga aagcacgaga 1740 

ttcttcgccc tccgagagct gcatcaggtc ggagacgctg tcgaactttfc cgatcagaaa 1800 

cttctcgaca gacgtcgcgg tgagttcagg catggtgatg tctgctcaag cggggfeagct 1860 

gfctagtcaag ctgcgatgaa gtgggaaagc tcgaactgaa aggttcaaag gaataaggga 1920 
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tgggaaggat ggagtatgga tgtagcaaag tacttactta ggggaaataa aggttcttgg 1980 

atgggaagat gaatafcactg aagatgggaa aagaaagaga aaagaaaaga gcagctggtg 2040 

gggagagcag gaaaatatgg caacaaatgt tggactgacg caacgacctt gtcaaccccg 2100 

ccgacacacc gggcggacag acggggcaaa gctgcctacc agggactgag ggacctcagc 2160 

aggtcgagtg cagagcaccg gatgggtcga ctgccagct't gtgttcccgg tctgcgccgc 2220 

tggccagctc ctgagcggcc tttccggttt catacaccgg gcaaagcagg agaggcacga 2280 

tatttggacg CCCtacagat gccggatggg eceiaULiiggg agcttO-Cgcg ccgggtactc 2340 

gctctaccta cttcggagaa ggtactatct cgtgaatctt ttaccagatc ggaagcaatt 2400 

ggacttctgt acctaggtta atggcatgct atttcgccga cggctataca cccctggctt 2460 

cacattctcc ttcgcttact gccggtgatt cgatgaagct ccatattctc cgatgatgca 2520 

atagattctt ggtcaacgag gggcacacca gcctttccac ttcggggcgg aggggcggee 2580 

ggtcccggat taataatcat ccactgcacc tcagagccgc cagagctgtc tggccagtgg 2640 

cttattactc agcccttctc tctgcgtccg tccgtctctc cgcatgccag aaagagfccac 2700 

cggtcactgt acagagctca cgagttcgtc acatttttct acaaatggtg gaggcggcgg 2760 

atttfcaggct caagtcatga ccctctgggt cactccagaa tcagctaggt caacgaataa 2 820 

ggatgattct ataggaagat ccaggcaccg gtcaaccatg atctggacag atttgggagc 2880 

tcggtataag ctctccacct atcttattct gtatagttta ggcttaaagt ttatccagga 2940 

gatgttgctg aagtcgattt gagtccactt cctcactggfc agctatacga ctttgatggt 3000 

cgttgtaggg gctgtafctag gtctcgatca aacacaaata gaattaaatg gtactcgagt 3060 

ccactgaagg tggcttctcc gtcttccgfca gccgtgccga aatccttaca gcttgtgttg 3120 

tgtgactttt ggttacgccg tctgactttt gtggtgagct aactagagat catgctatat 3180 
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ctcctgattt aatacaatgc tcatcataac attccacctg gaactgctag caacgtttga 3240 

cttgcattgt gcaacgccct ttgcagagct atcggatgat caatagtgcc acgttctaaa 3300 

ttcaaccaac gcaggtgccc caagccttcg acatccggat gtatttcgaa aacctcatgg 3360 

cgattgcagt cctcagattc atgttcattc caatgctcat tggtgaataa aaggttcaca 3420 

gggaataagt tcaaactcga gatacttgag aatattgaaa gccaaaggac cctctatgct 3480 

ccaagctaga gtctcagcct ggaaagcaaa tccaaatgaa gctatgctac ctccaattcc 3540 

tcatcaLcUU fitctataata cagagtcgaa gaatatcctc ttgacaoogo tocgtootoo 3600 

gacttcaata aggagcttac tcctccttga caccacccct ccagttcttc tcggcgttct 3660 

ggagggaggc cttgtcggtc ttgggctggc cctggctgag aaagctgttg gcagccttaa 3720 

agggacgctg gaggtcacca gtcgctggct tcccgaagac gtggatctta accagattcg 3780 

aaagcgcctt cagcggatga tcgaetggat cagaagagcg ttggtgtact tgaagtacag 3840 

atgcatgacg gccatcatgc caacgcccat gaactggctc ttaatgagct ggcggaactg 3900 

gcccttatcg tactccafcgt tggtagttgt gacaggacga. ggctcctcgc cgcttccaag 3960 

cggagcaggc tcgacgtatt tcagtgtcga aa.gatct.9at caayagacag gatg-aggatc 4020 

gtttcgcatg attgaacaag atggattgca cgcaggttct ccggccgctt gggtggagag 4080 

gctattcggc tatgactggg cacaacagac aatcggctgc tctgatgccg ccgfcgttccg 4140 

gctgtcagcg caggggcgcc cggttctttt tgtcaagacc gacctgtccg gtgccctgaa 4200 

tgaactgcag gacgaggcag cgcggctatc gtggctggcc acgacgggcg ttccttgcgc 4260 

agctgtgctc gacgttgtca ctgaagcggg aagggactgg ctgctattgg gcgaagtgcc 4320 

ggggcaggat cfccctgtcat ctcaccttgc tcctgccgag aaagtatcca tcatggctga 4380 

tgcaatgcgg cggctgcata cgcttgatcc ggctacctgc ccattcgacc accaagcgaa 4440 
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acatcgcatc gagcgagcac gtactcggat ggaagccggt cttgtcgatc aggatgafcct 4500 

ggacgaagag catcaggggc tcgcgccagc cgaactgttc gccaggctca aggcgcgcat 4560 

gcccgacggc gaggatctcg tcgtgaccca tggcgatgcc tgcttgccga atatcatggt 4620 

ggaaaatggc cgcttttctg gattcatcga cfcgtggccgg ctgggtgtgg cggaccgcta 4680 

tcaggacata gcgttggcta cccgtgatafc tgctgaagag cttggcggcg aatgggctga 4740 

ccgcttcctc gtgctttacg gfcafccgccgc tcccgafctcg cagcgcatcg ccttctatcg 4800 

ccttcttgac gagttcttct gagcgggact ctggggttcg aaatgaccga ccaagcgacg 4860 

cccaacctgc catcacgaga tttcgattcc accgccgcct tctatgaaag gttgggcttc 4920 

ggaatcgttt tccgggacgc cggctggatg atcctccagc gcggggatct catgchggag 49 80 

ttcttcgccc accccgggct cgatcccctc gcgagttggt tcagctgctg cctgaggctg 5040 

gacgacctcg cggagtfccta ccggcagtgc aaatocgtcg gca.tcca.g-ga. aaeoagoage S100 

ggctatccgc gcatccatgc ccccgaactg caggagtggg gaggcacgat ggccgctttg 5160 

gtccggatct ttgtgaagga accttacttc tgtggtgtga cataattgga caaactacct 522 0 

acagagattt aaagctctaa ggtaaatata aaatttttaa gtgtataatg tgttaaacta 5280 

otgatfcctaa ttgtttgtgt attttagatt ccaacctatg gaactgatga atgggagcag 5340 

tggtggaatg cctttaatga ggaaaacctg ttttgctcag aagaaatgcc atctagtgat 5400 

gatgaggcta ctgctgactc tcaacattct actcctccaa aaaagaagag aaaggtagaa 5460 

gaccccaagg actttccttc agaattguta agUtt-tUtga gtaatgofcgt gtttagtaat 5520 

agaactcttg cttgctttgc tatttacacc acaaaggaaa aagcfcgcact gctatacaag 5580 

aaaattatgg aaaaatattc tgtaaccttt ataagtaggc ataacagtta taatcataac 5640 
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atactgtttt ttcttactcc acacaggcat agagtgtctg ctatfcaataa ctatgctcaa 5700 

aaattgtgta cctttagctt tttaatttgt aaaggggtta ataaggaata tttgatgtat 5760 

agtgccttga ctagagatca taatcagcca taccacattt gtagaggttt tacttgcttt 5820 

aaaaaacctc ccacacctcc ccctgaacct gaaacataaa atgaatgcaa ttgttgttgt 5880 

taaetfcgfctt attgcagct-t- af-.3»hggtha naaataaacrc aatagcatca caaatttcac 5940 

aaataaagca tttttttcac tgcattctag ttgtggtttg tccaaactca tcaatgtatc 6000 

ttatcatgtc tggatctgac gggtgcgcat gatcgtgctc ctgbcgttga ggacccggct 6060 

aggctggcgg ggttgcctta ctggttagca gaatgaatca ccgatacgcg agcgaacgtg 6120 

aagcgactgc tgctgcaaaa cgtctgcgac ctgagcaaca acatgaatgg tcttcggttt 6180 

ccgtgtttcg taaagtctgg aaacgcggaa gtcagcgctc ttccgcttcc tcgctcactg 6240 

actcgcfcgcg ctcggtcgtt cggctgcggc gagcggtatc agctcactca aaggcggtaa 6300 

tacggtfcafcc cacagaatca ggggatsaag caggaaagaa catgtgagca aaaggceagc 6360 

aaaaggccag caaaaggcca ggaaccgtaa aaaggccgcg ttgctggcgt ttttccatag 6420 

gctccgcccc cctgacgagc atcacaaaaa tcgacgctca agtcagaggt ggcgaaaccc 6480 

gacaggacta taaagatacc aggcgtttcc ccctggaagc tccctcgtgc gctctcctgt 6540 

tccgaccctg ccgcttaccg gatacctgtc cgcctttctc ccttcgggaa gcgtggcgct 6600 

ttctcatagc tcacgctgta ggtatctcag ttcggtgtag gtcgttcgct ccaagctggg 6660 

cfcgtgtgcac gaaccccccg ttcagcccga ccgctgcgcc ttatccggta actatcgtct 6720 

tgagcccaac ccggtaagau acgacttatg gccacfcggca gcagccactg gtaacaggat £780 

tagcagagcg aggtatgtag gcggtgctac agagttcttg aagtggtggc ctaactacgg 6840 

ctacactaga aggacagtafc ttggtatctg cgctctgctg aagccagtta ccttcggaaa 6900 
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aagagttggt agctcttgat ccggcaaaca aaccaccgct ggtagcggtg gtttttttgt 6960 

ttgcaagcag cagattacgc gcagaaaaaa aggatctcaa gaagatcctt tgatcttttc 7020 

tacggggtct gacgctcagt ggaacgaaaa ctcacgttaa gggattttgg tcatgagatt 7080 

atcaaaaagg atcttcacct agatcctttt aaattaaaaa tgaagtfctta aatcaatcta 7140 

aagtatatat gagtsaaett ggtctgacacr ttaccaatgc ttaatcagtg aggcacctat 7200 

ctcagcgatc tgtctatttc gttcatccat agttgcctga ctccccgtcg tgtagataac 7260 

tacgatacgg gagggcttac catctggccc cagtgctgca atgafcaccgc gagacccacg 7320 

ctcaccggct ccagatttat cagcaataaa ccagceagcc ggaagggccg agcgcagaag 7380 

tggtcctgca actttatccg cctccatcca gtctattaat tgttgccggg aagctagagt 7440 

aagtagttog ccagttaata gtttgcgcaa cgttgttgcc attgctgcag gcatcgtggt 7500 

gtcacgctog tcgtttggta tggcttcatt cagctccggt tcccaacgat caaggcgagt 7560 

tacatsratcc ccoatgttgt gcaaaaaagc ggtfcagotr.r. fctegcrtcctc cgatcgttgt 7620 

cagaagtaag ttggccgcag tgttatcact catggttatg gcagcacfcgc ataattctct 7680 

tactgtcatg ccatccgtaa gatgcttttc tgtgactggt gagtactcaa ccaagtcatt 7740 

ctgagaatag tgtatgcggc gaccgagttg ctcttgcccg gcgtcaacac gggataatac 7800 

cgcgccacat agcagaactt taaaagtgct catcattgga aaacgttctt cggggcgaaa 7860 

actctcaagg atcttaccgc tgttgagatc cagttcgatg taacccactc gtgcacccaa 7920 

ctgatcttca gcatctttta ctttcaccag cgtttctggg tgagcaaaaa caggaaggca 7980 

aaatgccgca tiatiadgggaa taagggcgac aeggaaatgfc tgaatactca fcactcttccfe 8040 

ttttcaatat tattgaagca tbtatcaggg ttattgtctc atgagcggat aaatatttga 8100 

atgtatttag aaaaataaac aaataggggt tccgcgcaca tttccccgaa aagtgccacc 8160 
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tgacgtctaa gaaaccatta ttatcatgac attaacctafc aaaaataggc gtatcacgag 8220 

gccctttcgt cttcaagaat tcgcggccgc aattaaccct cactaaagga tccctatagfc 8280 

gagtcgtatt atgcggccgc gaattctcat gtttgaccgc ttatcatcga taagctctgc 8340 

tttttgttga ctteeattgt tcattccacg gacaaaaaca gagaaaggaa acgacagagg 8400 

cifiHaaaagct cgctttcaqc acctgtcgtt tcctttcttt tcagagggta ttttaaataa 8460 

aaacattaag ttatgacgaa gaagaacgga aacgccttaa accggaaaat tttcataaat 8520 

agcgaaaacc cgcgaggtcg ccgccccgta acaaggcgga tcgccggaaa ggacccgcaa 8580 

atgataataa ttatcaattg catactatcg acggcactgc tgccagataa caccaccggg 8640 

gaaacattcc atcatgatgg ccgtgcggac ataggaagcc agttcatcca tcgctttctt 8700 

gtctgctgcc atttgctttg tgacatccag cgccgcacat tcagcagcgt ttttcagcgc 8760 

gfctttcgatc aacgtttcaa tgttggtatc aacaccaggt ttaactttga acfctatcggc 8820 

actgacggtt accttgttct gcgctggctc atcacgcagg ataccaaggc tgatgttgta 8880 

gatattggtc accggctgag ggttttcgat tgccgctgcg tggatagcac catttgcgat 8940 

caggcngtcc ttgatgaatg acactccatt gcgaataagt tcgaaggaga cggtgtcacg 9000 

aatgcgctgg tccagctcgg tcgattgcct tttgtgcagc agaggtatca atctcaacgc 9060 

caaggctcat cgaagcgcaa tattgctgct caccaaaacg cgtattgacc aggtgttcaa 9120 

cggcaaattt ctgcccttct gatgtcagaa aggcaaagtg attttctttc tggtattcag 9180 

tfcgctgtgtg tcggtttcag caaaaccaag ctcgcgcaat tcggctgtgc agatttagaa 9240 

ggcagatcac cagacagcaa cggccaacgg aaaacagcgc atacagaaca tccgtcgccg 9300 

cgccgacaac gtgataattt ttatgaccca tgatttattt ccttttagac gtgagcctgt 9360 

cgcacagcaa agccgccgaa agttcctcga agctagcttc agacgtgtct agatacgtct 9420 
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gctttttgtt gacttccatt gttcattcca cggacaaaaa cagagaaagg aaacgacaga 9480 

ggccaaaaag ctcgcttfcca gcacctgfccg tttcctttct tttcagaggg tattttaaat 9540 

aaaaacatta agttatgacg aagaagaacg gaaacgcctt aaaccggaaa attttcataa 9600 

atagcgaaaa cccgcgaggt cgccgccccg taacaaggcg gafccgccgga aaggacccgc 9 660 

aaatgataat aattatcaat tgcatactat cgacggcact gctgccagat aacaccaccg 972 0 

gggaaacatt ccatcatgat ggccgtgcgg acataggaag ccagttcatc catcgctttc 9780 

ttgtctgctg ccatttgctt tgtgacatcc agcgccgcac attcaguagu gtttttcayc; 9840 

gcgttttcga tcaacgtttc aatgttggta tcaacaccag gtttaacttt gaacttatcg 9900 

gcactgacgg ttaccttgtt ctgcgctggc tcatcacgca ggataccaag gctgatgttg 9960 

tagatatfcgg tcaccggctg agggttttcg attgccgctg cgtggatagc accatttgcg 10020 

atcaggcngt ccttgatgaa tgacactcca ttgcgaataa gttcgaagga gacggtgtca 10080 

cgaatgcgct ggtccagctc ggtcgattgc cttttgtgca gcagaggtat caatctcaac 10140 

gccaaggctc atcgaagcgc aatattgctg ctcaccaaaa cgcgtattga ccaggfcgttc 10200 

aacggcaaat ttctgccctt ctgatgtcag aaaggcaaag tgattttctt tctggtattc 102t>0 

agttgctgtg tgtcggtttc agcaaaacca agctcgcgca attcggctgt gcagatttag 10320 

aaggcagatc accagacagc aacggccaac ggaaaacagc gcatacagaa catccgtcgc 10380 

cgcgccgaca acgtgataat ttttatgacc catgatttat ttccttttag acgtgagcct 10440 

gtcgcacagc aaagccgccg aaagttcctc gaccgatgcc cttgagagcc ttcaacccag 10500 

tcagctcctt ccggtgggcg cggggcatga ctatcgtcgc cgcacttatg actgtcttct 10560 

ttatcatgca actcgtagga caggtgccgg cagcgctcfcg ggtcattttc ggcgaggacc 10620 

gctttcgctg gagcgcgacg atgatcggcc tgtcgcttgc ggtattcgga atcttgcacg 10680 
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ccctcgctca agccttcgtc actggtcccg ccaccaaacg tttcggcgag aagcaggcca 10740 

ttatcgccgg catggcggcc gacgcgctgg gctacgtctt gctggcgttc gcgacgcgag 10800 

gctggatggc cttccccatt atgattcttc tcgcttccgg cggcatcggg atgcccgcgt 10860 

tgcaggccat gctgtccagg caggtagatg acgaccatca gggacagctt caaggatcgc 10920 

tcgcggctct taccagccta acttcgatca ttggaccgct gatcgtcacg gcgatttatg 10980 

ccgcctaggc gagcacatgg aacgggttgg catggattgt aggcgccgcc ctataccttg 11040 

tctgcctccc cgcgttgcgt cgcggtgcat ggagccgggc cacctcgacc tgaatggaag 11100 

ccggcggcac ctcgctaacg gattcaccac tccaagaatt ggagccaatc aattcttgcg 11160 

gagaactgtg aatgcgcaaa ccaacccttg gcagaacata tccatcgcgt ccgccatctc 11220 

cagcagccgc acgcggcgca tctcgggcag cgttgggtcc tgcagatccg gctgtggaat 11280 

gtgtgtcagt tagggtgtgg aaagtcccca ggctccccag caggcagaag tatgcaaagc 11340 

atgcatctca attagtcagc aaccaggtgt ggaaagtccc caggctcccc agcaggcaga 11400 

agtatgcaaa gcatgcatct caattagtca gcaaccatag tcccgcccct aactccgccc 11450 

atcccgcccc taactccgcc cagttccgcc cattctccgc cccatggctg actaattttt 11520 

tttatttatg cagaggccga ggccgcctcg gcctctgagc tattccagaa gtagtgagga 11580 

ggcttttttg gaggcctagg cttttgcaaa a 11611 

<210> 5 

<211> 21 

<2X2> DNK 

<213> Artificial 



<220> 

<223> Printer 
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<400> 5 

cgatgtagga gggcgtggat a 

<210> 6 

<211> 21 

<212> DNA 

<213> Artificial 



<220> 

<223> Primer 
<400> 6 

gcttctgcgg gcgatttgtg t 

<210> 7 

<211> 20 

<212> DNA 

<213> Artificial 

<220? 

<223> Primer 
<400> 7 

tgagaatatc accggaattg 

<210> 8 

<211> 21 

<212> DNA 

<213> Artificial 

<220> 

<223> Primer 
<400> 8 

agctcgacat actgttcttc c 



<210> 9 
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<211> 24 

<:212> DNA 

<213> Artificial 

<22G> 

<223> Primer 
<400> 9 

gtgaatggaa atcccatcgc tgtc 



<210> 10 

<211> 24 

<212> DNA 

<213> Artificial 

<220> 

<223> Primer 

<400> 10 

agtgggtact ctaaaggcca tacc 



<210> 11 

<211> 1771 

<212> DNA 

<213> Haematococcus pluvialis 



<220> 

<221> CDS 

<222> (166) .. (1155) 

<400> 11 

ggcacgagct tgcacgcaag tcagcgcgcg caagtcaaca cctgccggtc cacagcctca 60 

aataafcanag agctcaagcg fcfcfcgtgcgcc tcgaogtggc cagfcctgeao tgccttgaac 12 0 

ccgcgagtct cccgccgcac tgactgccat agcacagcta gacga atg cag eta gca 177 

Met Gin Leu Ala 

1 
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gcg aca gta atg ttg gag cag ctt acc gga age get gag gca etc aag 
Ala Thr Val Met Leu Glu Gin Leu Thr Gly Ser Ala Glu Ala Leu Lys 
5 10 15 20 

gag aag gag aag gag gtt gca ggc age tct gac gtg ttg cgt aca tgg 
Glu Lys Glu Lys Glu Val Ala Gly Ser Ser Asp Val Leu Arg Thr Trp 



gcg acc cag tac teg ctt ccg tea gaa gag tea gac gcg gec cgc ccg 
Ala Thr Gin Tyr Ser Leu Pro Ser Glu Glu Ser Asp Ala Ala Arg Pro 



gga ctg aag aat gec tac aag cca cca cct tec gac aca aag ggc ate 
Gly Leu Lys Asn Ala Tyr Lys Pro Pro Pro Ser Asp Thr Lys Gly He 



aca atg gcg eta cgt gtc ate ggc tec tgg gee gca gtg ttc etc cac 
Thr Met Ala Leu Arg Val He Gly Ser Trp Ala Ala Val Phe Leu His 
70 75 80 

gec att ttt caa ate aag ctt ccg acc tec ttg gac cag ctg cac tgg 
Ala lie Phe Sin He Lyo Leu Pro Thr Ser Lou Asp Gin Leu His Trp 
95 90 95 100 

ctg ccc gtg tea gat gee aca get cag ctg gtt age ggc acg age age 
Leu Pro Val Ser Asp Ala Thr Ala Gin Leu Val Ser Gly Thr Ser Ser 
105 HO 115 

ctg etc gac ate gtc gta gta ttc ttt gtc ctg gag ttc ctg tac aca 
Leu Leu Asp He Val Val Val Phe Phe Val Leu Glu Phe Leu Tyr Thr 
120 125 130 



ggc ctt ttt ate acc acg cat gat get atg cat ggc acc ate gec atg 
Gly Leu Phe He Thr Thr His Asp Ala Met His Gly Thr He Ala Met 
135 140 145 

aga aac agg cag ctt aat gac ttc ttg ggc aga gta tgc ate tec ttg 
Arg Asn Arg Gin Leu Asn Asp Phe Leu Gly Arg Val Cys He Ser Leu 
150 155 160 
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tac gcc tgg ttt gat tac aac atg ctg cac cgc aag cat tgg gag cac 705 
Tyr Ala Trp Phe Asp Tyr Asn Met Leu His Arg Lys His Trp Glu His 
165 170 175 180 

cac aac cac act ggc gag gtg ggc aag gac cct gac ttc cac agg gga 753 
His Asn His Thr Gly Glu Val Gly Lys Asp Pro Asp Phe His Arg Gly 
185 190 195 

aan cct gac att gtcr ccc tgg ttt gcc age ttc atg tec age tac atg 801 
Asn Pro Gly lie Val pro Trp Phe Ala Ser Phe Met Ser Ser Tyr Met 
200 205 210 

teg atg tgg cag ttt gcg cgc etc gca tgg tgg acg gtg gtc atg cag 849 
Ser Met Trp Gin Phe Ala Arg Leu Ala Trp Txp Thx Val Val Met Gin 
215 220 225 

ctg ctg ggt gcg cca atg gcg aac ctg ctg gtg ttc atg gcg gcc gcg 897 
Leu Leu Gly Ala Pro Met Ala Asn Leu Leu Val Phe Met Ala Ala Ala 
230 235 240 

ccc ate ctg tec gcc ttc cgc ttg ttc tac ttt ggc acg tac atg ccc 945 
Pro He Leu Ser Ala Phe Arg Leu Phe Tyr Phe Gly Thr Tyr Met Pro 
345 250 255 260 



cac aag cct gag cct ggc gcc gcg tea ggc tct tea cca gcc gtc atg 
His Lys Pro Glu Pro Gly Ala Ala Ser Gly Ser Ser Pro Ala Val Met 
265 ■ 270 275 

aac tgg tgg aag teg cgc act age cag gcg tec gac ctg gtc age ttt 
Asn Trp Trp Lys Ser Arg Thr Ser Gin Ala Ser Asp Leu Val Ser Phe 
280 285 290 

ctg acc tgc tac cac ttc gac ctg cac tgg gag cac cac cgc tgg ccc 
Leu Thr Cys Tyr His Phe Asp Leu His Trp Glu His His Arg Trp Pro 
295 300 305 

ttc gcc ccc tgg tgg gag ctg ccc aac tgc cgc cgc ctg tct ggc cga 
Phe Ala Pro Trp Trp Glu Leu Pro Asn Cys Arg Arg Leu Ser Gly Arg 
310 315 320 



ggt ctg gtt cct gcc tag ctggacacac tgcagtgggc cctgctgcca 



1185 
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Gly Leu Val Pro Ala 
325 

gctgggcatg caggttgtgg caggactggg tgaggtgaaa agctgcaggc gctgctgccg 1245 

gacacgctgc atgggctacc ctgtgtagct gccgccacfca ggggaggggg fcttgtagctg 1305 

tcgagcttgc cccatggatg aagctgtgta gtggtgcagg gagtacaccc acaggccaac 1365 

acccttgcag gagatgtctt gcgtcgggag gagtgttggg cagtgtagat gctatgattg 1425 

tatcttaatg ctgaagcctt taggggagcg acacttagtg ctgggcaggc aacgccctgc 1485 

aaggtgcagg cacaagctag gctggacgag gactcggtgg caggcaggtg aagaggtgcg 1545 

ggagggtggt gccacaccca ctgggcaaga ccatgctgca atgctggcgg tgtg'gcagtg 1605 

agagctgcgt gattaactgg gctatggatt gttfcgagcag tctcacttat tctttgatat 1665 

.agatactggt caggcaggtc aggagagtga gtatgaacaa gttgagaggt ggtgcgctgc 1725 

ccctgcgctt atgaagctgt aacaataaag tggttcaaaa aaaaaa 1771 

<210> 12 
<211> 329 
<212> PRT 

<213> Haematococcus pluviaiis 
<400> 12 

Met Gin Leu Ala Ala Thr Val Met Leu Glu Gin Leu Thr Gly Ser Ala 



1 



5 



10 



15 



Glu Ala Leu Lys Glu Lys Glu Lys Glu Val Ala 



Gly Ser Ser Asp Val 



20 



25 



30 



Leu Arg Thr Trp Ala Hit Gin Tyr Ser Leu Pro 



Ser Glu Glu Ser Asp 



35 



40 



45 
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Ala Ala Arg Pro Gly Leu Lys Asn Ala Tyr Lys Pro Pro Pro Ser Asp 



Thr Lys Gly He Thr Met Ala Leu Arg Val He Gly Ser Trp Ala Ala 



Val Phe Leu His Ala He Phe Gin He Lys Leu Pro Thr Ser Leu Asp 



Gin Leu His Trp Leu Pro Val Ser Asp Ala Thr Ala Gin Leu Val Ser 
100 105 HO 



Gly Thr Ser Ser Leu Leu Asp He Val Val Val Phe Phe Val Leu Glu 
115 120 125 



PLe Leu Tyr Thr Gly Lou Phe II© Thr Thr His Asp Ala Met His Gly 
130 135 140 



Thr He Ala Met Arg Asn Arg Gin Leu Asn Asp Phe Leu Gly Arg Val 
145 150 155 160 



Cys He Ser Leu Tyr Ala Trp Phe Asp Tyr Asn Met Leu His Arg Lys 
165 170 175 



His Trp Glu His His Asn His Thr Gly Glu Val Gly Lys Asp Pro Asp 
180 185 190 



Phe His Arg Gly Asn Pro Gly He Val Pro Trp Phe Ala Ser Phe Met 
195 200 205 
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Ser Ser Tyr Met Ser Met Trp Gin Pne Ala Arg Leu Ala Trp Trp Thr 
210 215 220 



Val Val Met Gin Leu Leu Gly Ala Pro Met Ala Asn Leu Leu Val Phe 
225 230 235 • 240 



Met Ala Ala. Ala Pro He Leu Ser Ala Phfi Arg Leu Phe Tyr Phe Gly 
245 250 255 



Thr Tyr Met Pro His Lys Pro Glu Pro Gly Ala Ala Ser Gly Ser Ser 
260 265 270 



Pro Ala Val Met Asn Trp Trp Lys Ser Arg Thr Ser Gin Ala Ser Asp 
275 280 285 



Leu Val Ser Phe Leu Thr Cys Tyr His Phe Asp Leu His Trp Glu His 
290 295 300 



His Arg Trp Pro Phe Ala Pro Trp Trp Glu Leu Pro Asn Cys Arg Arg 
305 310 315 320 



Leu Ser Gly Arg Gly Leu Val Pro Ala 
325 



<210> 13 

<211> 1662 

<212> DNA 

<213> Haematococcus pluvial is 



<220> 
<221> 
<222> 



CDS 

(168) ..(1130) 
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<400> 13 

cggggcaact caagaaattc aacagctgca agcgcgcccc agcctcacag cgccaagtga 

gctatcgacg tggttgtgag cgctcgacgt ggtccactga cgggcctgtg agcctctgcg 

ctccgtcctc tgccaaatct cgcgtcgggg cctgcctaag tcgaaga atg cac gtc 

Met His Val 



gca teg gca eta atg gtc gag cag'aaa ggc agt gag gca get get tec 
Ala Ser Ala Leu Met Val Glu Gin Lys Gly Ser Glu Ala Ala Ala Ser 
5 10 15 

age cca gac gtc ttg aga gcg tgg gcg aca cag tat cac atg cca tec 
Ser Pro Asp Val Leu Arg Ala Trp Ala Thr Gin Tyr His Met Pro Ser 
20 25 30 35 

gag teg tea gac gca get cgt cct gcg eta aag cac gec tac aaa cct 
Glu Ser Ser Asp Ala Ala Arg Pro Ala Leu Lys His Ala Tyr Lys Pro 



cca gca tct gac gec aag ggc ate acg atg gcg ctg acc ate att ggc 
Pro Ala Ser Asp Ala Lya Gly II© Thr Mot Ala Leu Th.r He Tie Sly 



acc tgg acc gca gtg ttt tta cac gca ata ttt caa ate agg eta ccg 
Thr Trp Thr Ala Val Phe Leu His Ala He Phe Gin He Arg Leu Pro 



aca tec atg gac cag ctt cac tgg ttg cct gtg tec gaa gec aca gec 
Thr Ser Met Asp Gin Leu His Trp Leu Pro Val Ser Glu Ala Thr Ala 
85 90 95 

cag ctt ttg ggc gga age age age eta ctg cac ate get gca gtc ttc 
Gin Leu Leu Gly Gly Ser Ser Ser Leu Leu His lie Ala Ala Val Phe 
100 105 HO 115 

att gta ctt gag ttc ctg tac act ggt eta ttc ate acc aca cat gac 
He Val Leu Glu Phe Leu Tyr Thr Gly Leu Phe He Thr Thr His Asp 
120 125 130 

gca atg cat ggc acc ata get ttg agg cac agg cag etc aat gat etc 
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Ala Met His Gly Thr lie Ala Leu Arg His Arg Gin Leu Asn Asp Leu 
135 140 145 



ctt ggc aac ate tgc ata tea ctg tac gec tgg ttt gac tac age atg 656 
Leu Gly Asn lie Cys lie Ser Leu Tyr Ala Trp Phe Asp Tyr Ser Met 
150 155 160 

ctg cat cgc aag cac tgg gag cac cac aac cat act ggc gaa gtg ggg 704 
T,eu Hi a ftrg Lys His Trp. Glu His His Asn His Thr Gly Glu Val Gly 
165 170 175 



aaa gac cct gac ttc cac aag gga aat ccc ggc ctt gtc ccc tgg ttc 752 
Lys Asp Pro Asp Phe His Lys Gly Asn Pro Gly Leu Val Pro Trp Phe 
180 185 . 190 195 



gec age ttc atg tec age tac atg tec ctg tgg cag ttt gec egg ctg 800 
Ala Ser Phe Met Ser Ser Tyr Met Ser Leu Trp Gin Phe Ala Arg Leu 
200 205 210 



gca tgg tgg gca gtg gtg atg caa atg ctg ggg gcg ccc atg gca aat 
Ala Trp Trp Ala Val Val Met Gin Met Leu Gly Ala Pro Met Ala Asn 
215 220 225' 

etc eta gtc ttc atg get gca gec cca ate ttg tea gca ttc cgc etc 
Leu Leu Val Phe Met Ala Ala Ala Pro lie Leu Ser Ala Phe Arg Leu 
230 235 240 



ttc tac ttc ggc act tac ctg cca cac aag cct gag cca ggc cct gca 344 
Phe Tyr Phe Gly Thr Tyr Leu Pro His Lys Pro Glu Pro Gly Pro Ala 
245 250 255 



gca ggc tct cag gtg atg gec tgg ttc agg gec aag aca agt gag gca 
Ala Gly Ser Gin Val Met Ala Trp Phe Arg Ala Lys Thr Ser Glu Ala 
260 265 270 275 

tct gat gtg atg agt ttc ctg aca tgc tac cac ttt gac ctg cac tgg 
Ser Asp Val Met Ser Ph.e Dssxi Hir Cys Tyr His PHe Asp Leu Hia Trp 
280 285 290 



gag cac cac agg tgg ccc ttt gec ccc tgg tgg cag 
Glu His His Arg Trp Pro Phe Ala Pro Trp Trp Gin 
295 300 



ctg ccc cac tgc 
Leu Pro His Cys 
305 



1088 
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cgc cgc ctg tec ggg cgt ggc ctg gtg cct gcc ttg gca tga 1130 
Arg Arg I>eu Ser Gly Arg Gly Leu Val Pro Ala Leu Ala 
310 315 320 

cctggtccct ccgctggtga cccagcgtct gcacaagagt gtcatgetae agggtgctgc 1190 

ggccagtggc agcgcagtgc actctcagcc tgfcatggggc taccgctgtg ccactgagca 1250 

ctgggcatgc cactgagcac tgggcgtgct actgagcaat gggcgtgcta ctgagcaatg 1310 

ggcgtgctac tgacaatggg cgtgctactg gggtctggca gtggctagga tggagtttga 1370 

tgcattcagt agcggtggcc aacgtcatgt ggatggtggei agtgctgagg ggtttaggca 143 0 

geeggcattt gagagggcta agttataaat cgcatgctgc tcatgcgcac atatctgeae 1490 

acagecaggg aaatcccttc gagagtgatt atgggacact tgtattggtt tcgtgct'att 1550 

gtttfcattca gcagcagtac ttagtgaggg tgagagcagg gtggtgagag tggagtgagt 1610 

gagtatgaac ctggtcagcg aggtgaacag cctgtaatga atgactctgt ct 1662 



<210> 14 

<211> 320 

<212> PRT 

<213> Haematococcus pluviaiis 



Met His Val Ala Ser Ala Leu Met Val Glu Gin Lys Gly Ser Glu Ala 
15 10 15 



Ala Ala Ser Ser Pro Asp Val Leu Arg Ala Trp Ala Thr Gin Tyr His 



Met Pro Ser Glu Ser Ser Asp Ala Ala Arg Pro Ala Leu Lys His Ala 
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Tyr Lys Pro Pro Ala Ser Asp Ala Lys Gly He Thr Met Ala Leu Thr 



lie He Gly Thr Trp Thr Ala Val Phe Leu His Ala He Phe Gin He 



Arg Leu Pro Thr Ser Met Asp Gin Leu His Trp Leu Pro Val Ser Glu 



Ala Thr Ala Gin Leu Leu Gly Gly Ser Ser Sex i.eu Leu. His xle Ala 
100 105 HO 



Ala Val Phe He Val Leu Glu Phe Leu Tyr Thr Gly Leu Phe He Thr 
115 120 125 



Thr His Asp Ala Met His Gly Thr He Ala Leu Arg His Arg Gin Leu 
130 135 140 



Asn Asp Leu Leu Gly Asn He Cys He Ser Leu Tyr Ala Trp Phe Asp 
145 150 155 160 



Tyr Ser Met Leu His Arg Lys His Trp Glu His His Asn His Thr Gly 
165 . 170 175 



Glu Val Gly Lys Asp Pro Asp Phe His Lys Gly Asn Pro Gly Leu Val 
180 185 190 



Pro Trp Phe Ala Ser Phe Met Ser Ser Tyr Met Ser Leu Trp Gin Phe 
195 200 205 



Ala Arg Leu 



Ala Trp Trp Ala Val Val Met Gin Met Leu Gly Ala Pro 
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210 215 220 



Met Ala Asn Leu Leu Val Pile Met Ala Ala Ala Pro lie Leu Ser Ala 
225 230 235 240 



Phe Arg Leu Phe Tyr Phe Gly Thr Tyr Leu Pro His Lys Pro Glu Pro 
245 250 255 



Gly Pro Ala Ala Gly Ser Gin Val Met Ala Trp Phe Arg Ala Lys Thr 
260 265 270 



Ser Glu Ala Ser Asp Val Met Ser Phe Leu Thr Cys Tyr His Phe Asp 
275 280 285 



Leu His Trp Glu His His Arg Trp Pro Phe Ala Pro Trp Trp Gin Leu 
290 295 300 



Pro His Cys Arg Arg Leu Ser Gly Arg Gly Leu Val Pro Ala Leu Ala 
305 310 315 320 



<210> 15 

<211> 729 

<212> DNA 

<213> Agrobacterium aurantiacura 

<220> 

<221> CDS 

<222> (1)..(729) 

<400> 15 

atg age gca cat gec ctg ccc aag gca gat ctg acc gec ace age ctg 

Met Ser Ala His Ala Leu Pro Lys Ala Asp Leu Thr Ala Thr Ser Leu 
15 10 15 
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ate gtc teg ggc ggc ate ate gec get tgg ctg gee ctg cat gtg cat 96 
lie Val Ser Gly Gly He He Ala Ala Trp Leu Ala Leu His Val His 
20 25 30 

gcg ctg tgg ttt ctg gac gca gcg gcg cat ccc ate ctg gcg ate gca 144 
Ala Leu Trp Phe Leu Asp Ala Ala Ala His Pro He Leu Ala He Ala 
35 40 45 

aat ttc ctg ggg ctg acc tgg ctg teg gtc gga ttg ttc ate ate gcg 192 
Asn Phe Leu Gly Leu Thr Trp Leu Ser Val Gly Leu Phe He He Ala 
50 55 60 

cat gac geg atg cac ggg teg gtg gtg ccg ggg cgt ccg cgc gee aat 240 
His Asp Ala Met His Gly Sex Veil Va.1 Pro Gly Arg Pro Arg Ala Asia 
65 70 75 80 

gcg gcg atg ggc cag ctt gtc ctg tgg ctg tat gee gga ttt teg tgg 288 
Ala Ala Met Gly Gin Leu Val Leu Trp Leu Tyr Ala Gly Phe Ser Trp 
85 90 95 

cgc aag atg ate gtc aag cac atg gee cat cac cgc cat gec gga acc 336 
Arg Lys Met He Val Lys His Met Ala His His Arg His Ala Gly Thr 
100 105 110 

gac gac gac ccc gat ttc gac cat ggc ggc ccg gtc cgc tgg tac gec 384 
Asp Asp Asp Pro Asp Phe Asp His Gly Gly Pro Val Arg Trp Tyr Ala 
115 120 125 

cgc ttc ate ggc acc tat ttc ggc tgg cgc gag ggg ctg ctg ctg ccc 432 
Arg Phe He Gly Thr Tyr Phe Gly Trp Arg Glu Gly Leu Leu Leu Pro 
130 , 135 140 

gtc ate gtg acg gtc tat gcg ctg ate ctt ggg gat cgc tgg atg tac 480 
Val He Val Thr Val Tyr Ala Leu He Leu Gly Asp Arg Trp Met Tyr 
145 150 155 160 

gtg gfca ttc tgg ccg ctg ccg teg ate ctg gcg teg ate cag ctg ttc 528 
Val Val Phe Trp Pro Ley Pro Ser He. Leu Ala Ser He Gin Leu Phe 
165 170 175 

gtg ttc ggc acc tgg etg ccg cac cgc ccc ggc cac gac gcg ttc ccg 576 
Val Phe Gly Thr Trp Leu Pro His Arg Pro Gly His Asp Ala Phe Pro 
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gac cgc cac aat gcg egg teg teg egg ate age gac ccc gtg teg ctg 
Asp Arg His Asn Ala Arg Ser Ser Arg He Ser Asp Pro Val Ser Leu 
195 200 205 

ctg acc tgc ttt cac ttt ggc ggt tat cat cac gaa cac cac ctg cac 
Leu Thr Cys Phe His Phe Gly Gly Tyr His His Glu His His Leu His 
210 215 220 

ccg acg gtg ccg tgg tgg cgc ctg ccc age acc cgc acc aag ggg gac 
Pro Thr Val Pro Tip Trp Arg Leu Pro Ser Thr Arg Thr Lys Gly Asp 
225 230 235 240 

acc gca tga 
Thr Ala 



<210> 16 

<211> 242 

<212> PRT 

<213s- Agrobactcsrium aurantiacum 



Met Ser Ala His Ala Leu Pro Lys Ala Asp Leu Thr Ala Thr Ser Leu 



lie Val Ser Gly Gly He He Ala Ala Trp Leu Ala Leu His Val His 



Ala Leu Trp Phe Leu Asp Ala Ala Ala His Pro He Leu Ala He Ala 
35 40 45 



Asn Phe Leu Gly Leu Thr Trp Leu Ser Val Gly Leu Phe He He Ala 
50 55 60 
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His Asp Ala Met His Gly Ser Val Val Pro Gly Arg Pro Arg Ala Asn 



Ala Ala Met Gly Gin Leu Val Leu Tip Leu Tyr Ala Gly Phe Ser Trp 
85 90 95 



Arg Lys Met lie Val Lys His Met Ala His His Arg His Ala Gly Thr 
100 105 110 



Asp Asp Asp Pro Asp Plie Asp His Gly Gly Pro Val Arg Trp Tyr Ala 
115 120 125 



Arg Phe lie Gly Thr Tyr Phe Gly Trp Arg Glu Gly Leu Leu Leu Pro 
130 135 140 



Val lie Val Thr Val Tyr Ala Leu He Leu Gly Asp Arg Trp Met Tyr 
145 150 155 160 



Val Val Phe Trp Pro Leu Pro Ser He Leu Ala Ser He Gin Leu Phe 
165 170 175 



Val Phe Gly Thr Trp Leu Pro His Arg Pro Gly His Asp Ala Phe Pro 
180 185 190 



Asp Arg His Asn Ala Arg Ser Ser Arg He Ser Asp Pro Val Ser Leu 
195 200 205 



Leu Thr Cys Phe His Phe Gly Gly Tyr His His Glu His His Leu His 
210 215 220 



Pro Thr Val Pro Trp Trp Arg Leu Pro Ser Thr Arg Thr Lys Gly Asp 
225 230 235 240 
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Thr Ala 



<210> 17 

<211> 1631 

<2X2> UMA 

<213> Alcaligenes sp. 



<220> 

<221> CDS 

<222> (99).. (827) 

<400> 17 

ctgcaggccg ggcccggtgg ccaatggtcg caaccggcag gactggaaca ggacggcggg 60 

ccggtctagg ctgtcgccct acgcagcagg agtttcgg atg tec gga egg aag cct 116 

Met Ser Gly Arg Lys Pro 
1 5 

ggc aca act ggc gac acg ate gtc aat etc ggt ctg acc gee gcg ate 164 
Gly Thr Thr Gly Asp Thr lie Val Asn Leu Gly Leu Thr Ala Ala lie 
10 15 20 

ctg ctg tgc tgg ctg gtc ctg cac gec ttt acg eta tgg ttg eta gat 212 
Leu Leu Cys Trp Leu Val Leu His Ala Phe Thr Leu Trp Leu Leu Asp 
25 30 35 

acg gee gcg cat ccg ctg ctt gec gtg ctg tgc ctg get ggg ctg acc 260 
Ala Ala Ala His Pro Leu Leu Ala Val Leu Cys Leu Ala Gly Leu Thr 
40 45 50 

tgg ctg teg gtc ggg ctg ttc ate ate gcg cat gac gca atg cac ggg 308 
Trp Leu Ser Val Gly lieu PLe lie lie Ala. His Asp Ala Met His Gly 
55 60 65 70 

tec gtg gtg ccg ggg egg ccg cgc gee aat gcg gcg ate ggg caa ctg 356 

Ser Val Val Pro Gly Arg Pro Arg Ala Asn Ala Ala lie Gly Gin Leu 
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75 80 85 

gcg ctg tgg etc tat gcg ggg ttc teg tgg ccc aag ctg ate gee aag 404 
Ala Leu Trp Leu Tyr Ala Gly Phe Ser Trp Pro Lys Leu lie Ala Lys 
90 95 100 

cac atg acg cat cac egg cac gec ggc acc gac aac gat ccc gat ttc 452 
His Met Thr His His Arg His Ala Gly Thr Asp Asn Asp Pro Asp Phe 
105 110 H5 

ggt cac gga ggg ccc gtg cgc tgg tac ggc age ttc gtc tec acc tat 500 
Gly His Gly Gly Pro Val Arg Trp Tyr Gly Ser Phe Val Ser Thr Tyr 
120 125 130 

ttc ggc tgg cga gag gga ctg ctg eta ccg gtg ate gtc acc acc tat 548 
Phe Gly Trp Arg Glu Gly Leu Leu Leu Pro Val lie Val Thr Thr Tyr 
135 140 145 150 

gcg ctg ate ctg ggc gat cgc tgg atg tat gtc ate ttc tgg ccg gtc 596 
Ala Leu lie Leu Gly Asp Arg Trp Met Tyr Val lie Phe Trp Pro Val 
155 160 165 

cog gec gtt cfcg gcg tog atr. nag aht ttc gtc ttc gga act tgg ctg 644 
Pro Ala Val Leu Ala Ser lie Gin lie Phe Val Phe Gly Thr Trp Leu 
170 175 180 

ccc cac cgc ccg gga cat gac gat ttt ccc gac egg cac aac gcg agg 692 
Pro His Arg Pro Gly His Asp Asp Phe Pro Asp Arg His Asn Ala Arg 
185 190 195 

teg acc ggc ate ggc gac ccg ttg tea eta ctg acc tgc ttc cat ttc 740 

Ser Thr Gly He Gly Asp Pro Leu Ser Leu Leu Thr Cys Phe His Phe 
200 205 210 

ggc ggc tat cac cac gaa cat cac ctg cat ccg cat gtg ccg tgg tgg 788 
Gly Gly Tyr His His Glu Hies Hie Leu His Piro Hie Val Pro Trp Trp 
215 220 225 230 

cgc ctg cct cgt aca cgc aag acc gga ggc cgc gca tga cgcaattcct 837 
Arg Leu Pro Arg Thr Arg Lys Thr Gly Gly Arg. Ala 
235 240 
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cattgtcgtg gcgacagtcc tcgtgatgga gctgaccgcc tattccgtcc accgctggat 897 

tatgcacggc ccccfcaggct ggggctggca caagtcccat cacgaagagc acgaccacgc 957 

gttggagaag aacgacctct acggcgtcgt cttcgcggtg ctggcgacga tcctcttcac 1017 

cgtgggcgcc tattggtggc cggtgcfcgtg gtggatcgcc ctgggcatga cggtctatgg 1077 

gttgatctat fctcatcctgc acgacgggct tgtgcatcaa cgctggccgt ttcggtatat 1137 

fcccgcggcgg ggctatttcc gcaggctcta ccaagctcat cgcctgcacc acgcggtcga 1197 

ggggcgggac cactgcgtca gcttcggctt catctatgcc ccacccgtgg acaagctgaa' 1257 

gcaggatctg aagcggtcgg gtgtcctgcg cccccaggac gagcgtccgt cgtgatctct 1317 

gatcccggcg tggccgcatg aaatccgacg tgctgctggc aggggccggc cttgccaacg 1377 

gactgatcgc gctggcgatc cgcaaggcgc ggcccgacct tcgcgtgctg ctgctggacc 1437 

gtgcggcggg cgcctdggac gggaatacfct ggfcccfcgcca cgacaccgat ttggcgcege 1497 

actggctgga ccgcctgaag ccgatcaggc gtggcgacfcg gcccgatcag gaggtgcggt 1557 

tcccagacca ttcgcgaagg ctccgggccg gatatggctc gatcgacggg cgggggctga 1617 

tgcgtgcggt gacc 1631 



<210> 18 
<211> 242 
<212> PRT 

<213> Alcaligenes sp. 
<400> 18 

Met Ser Gly Arg Lys Pro Gly Thr Thr Gly Asp Thr He Val Asn Leu 
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Gly Leu Thr Ala Ala He Leu Leu Cys Trp Leu Val Leu His Ala Phe 
20 25 30 



Thr Leu Trp Leu Leu Asp Ala Ala Ala His Pro Leu Leu Ala Val Leu 
35 " 40 45 



Cy& Leu Ala Gly Leu Thr Trp Leu Ser Val Gly Leu Phe He He Ala 
50 55 60 



His Asp Ala Met His Gly Ser Val Val Pro Gly Arg Pro Arg Ala Asn 
65 70 75 80 



Ala Ala He Gly Gin Leu Ala Leu Trp Leu Tyr Ala Gly Phe Ser Trp 
85 90 95 



Pro Lys Leu He Ala Lys His Met Thr His His Arg His Ala Gly Thr 
100 105 110 



Asp Asxi Asp Pro Asp Phe Gly His Gly Gly Pro Val Arg Trp Tyr Gly 
115 120 125 



Ser Phe Val Ser Thr Tyr Phe Gly Trp Arg Glu Gly Leu Leu Leu Pro 
130 135 140 



Val He Val Thr Thr Tyr Ala Leu He Leu Gly Asp Arg Trp Met Tyr 
145 150 155 160 



Val He Pte Trp Pro Val Pro Ala Val Leu Ala Eer Xle Gin lis Ph© 
165 170 175 



Val Phe Gly Thr Trp Leu Pro His Arg Pro Gly His Asp Asp Phe Pro 
180 185 190 
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Asp Arg His Asn Ala Arg Ser Thr Gly lie Gly Asp Pro Leu Ser Leu 
195 200 205 



Leu Thr Cys Phe His Phe Gly Gly Tyr His His Qlu His His Leu His 
210 215 220 



Pro His Val Pro Trp Trp Arg Leu Pro Arg Thr Arg Lys Thr Gly Gly 
225 230 235 240 



<210> 19 

<211> 729 

<212> DNA 

<213> Paracoccus marcusii 



<220> 

<221> CDS 

<222> (1)..(729) 



<4Q0> 19 

atg age gca cat gec ctg ccc aag gca gat ctg acc gec aca age ctg 
Met Ser Ala His Ala Leu Pro Lys Ala Asp Leu Thr Ala Thr Ser Leu 



ate gtc teg ggc gge ate ate gec gca tgg ctg gec ctg cat gtg cat 
lie Val Ser Gly Gly lie lie Ala Ala Trp Leu Ala Leu His Val His 
on 25 30 



gcg ctg tgg ttt ctg gac gcg gcg gee 



cat ccc ate ctg gcg gtc gcg • 144 



Ala Leu Trp Phe Leu Asp Ala Ala Ala His Pro He Leu Ala Val Ala 
35 40 45 

aat ttc ctg ggg ctg acc tgg ctg teg gtc gga ttg ttc ate ate gcg 192 
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Asn Phe Leu Gly Leu Thr Trp Leu Ser Val Gly Leu Phe He He Ala 
50 55 60 

cat gac gcg atg cac ggg teg gtc gtg ccg ggg cgt ccg cgc gec aat 240 
His Asp Ala Met His Gly Ser Val Val Pro Gly Arg Pro Arg Ala Asn 
65 70 75 80 

gcg gcg atg ggc cag ctt gtc ctg tgg ctg tat gec gga ttt teg tgg 288 
Ala Ala Met Gly Gin Leu Val Leu Trp Leu Tyr Ala Glv Phe Ser Trp 
85 90 95 

cgc aag atg ate gtc aag cac atg gec cat cac cgc cat gec gga acc 336 
Arg Lys Met He Val Lys His Met Ala His His Arg His Ala Gly Thr 
100 10b 110 

gac gac gac cca gat ttc gac cat ggc ggc ccg gtc cgc tgg tac gec 384 
Asp Asp Asp Pro Asp Phe Asp His Gly Gly Pro Val Arg Trp Tyr Ala 
115 120 125 

cgc ttc ate ggc acc tat ttc ggc tgg cgc gag ggg ctg ctg ctg ccc 432 
Arg Phe He Gly Thr Tyr Phe Gly Trp Arg Glu Gly Leu Leu Leu Pro 
130 135 140 

gtc ate gtg acg gtc tat gcg ctg ate ctg ggg gat cgc tgg atg tac 480 
Val He Val Thr Val Tyr Ala Leu He Leu Gly Asp Arg Trp Met Tyr 
145 150 155 160 

gtg gtc ttc tgg ccg ttg ccg teg ate ctg gcg teg ate cag ctg ttc 528 
Val Val Phe Trp Pro Leu Pro Ser He Leu Ala Ser He Gin Leu Phe 
165 170 175 

gtg ttc ggc act tgg ctg ccg cac cgc ccc ggc cac gac gcg ttc ccg 576 
Val Phe Gly Thr Trp Leu Pro His Arg Pro Gly His Asp Ala Phe Pro 
180 185 190 

gac cgc cat aat gcg egg teg teg egg ate age gac cct gtg teg ctg 624 
Asp Arg His Asn Ala. Arg Ser Ser Arg lie Ser Asp Pro Val Ser Leu 
195 200 205 

ctg acc tgc ttt cat ttt ggc ggt tat cat cac gaa cac eac ctg cac 672 
Leu Thr Cys Phe His Phe Gly Gly Tyr His His Glu His His Leu His 
210 215 220 



WO 2004/063358 



49/358 



PCT/EP2004/000100 



ccg acg gtg ccg tgg tgg cgc ctg ccc age acc cgc acc aag ggg gac 720 
Pro Thr Val Pro Trp Trp Arg Leu Pro Ser Thr Arg Thr Lys Gly Asp 
225 230 235 240 

729 

acc gca tga 
Thr Ala 



<210> 20 

<211> 242 

<212> PRT 

<213> Paracoccus marcusii 



<400> 20 

Met Ser Ala His Ala Leu Pro Lys Ala Asp Leu Thr Ala Thr Ser Leu 
15 10 15 



lie Val Ser Gly Gly He He Ala Ala Trp Leu Ala Leu His Val His 



Ala Leu Trp Phe Leu Asp 



Ala Ala Ala His Pro He Leu Ala Val Ala 



Asn Phe Leu Gly Leu 



Thr Trp Leu Ser Val Gly Leu Phe He He Ala 



His Asp Ala Met His Gly Ser Val Val Pro Gly Arg Pro Arg Ala Asn 



Ala Ala Met Gly Gin Leu Val Leu Trp Leu Tyr Ala Gly Phe Ser Trp 
85 90 35 



Arg Lys Met He Val Lys His Met Ala His His Arg His Ala Gly Thr 



WO 2004/063358 PCT/EP2004/000100 
50/358 

100 105 110 

Asp Asp Asp Pro Asp Phe Asp His Gly Gly Pro Val Arg- Trp Tyr Ala 
115 120 125 



Arg Phe lie Gly Thr Tyr Phe Gly Trp Arg Glu Gly Leu Leu Leu Pro 
130 135 140 



Val lie Val Thr Val Tyr Ala Leu He Leu Gly Asp Arg Trp Met Tyr 
145 150 155 160 



Val Val Phe Trp Pro Leu Pro Ser He Leu Ala Ser He Gin Leu Phe 
165 170 175 



Val Phe Gly Thr Trp Leu Pro His Arg Pro Gly His Asp Ala Phe Pro 
180 185 190 



Asp Arg His Asn Ala Arg Ser Ser Arg He Ser Asp Pro Val Ser Leu 
195 200 205 



Leu Thr Cys Phe His Phe Gly Gly Tyr His His Glu His His Leu His 
210 215 220 



Pro Thr Val Pro Trp Trp Arg Leu Pro Ser Thr Arg Thr Lys Gly Asp 
225 230 235 240 



• Thr- Ala 



<210> 21 
<211> 1629 
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<212> DNA 

<213> Synechocystis sp. 



<220> 

<221> CDS 

<222> {1)..(1629) 

<400> 21 

atg ate acc acc gat gtt gtc afet att ggg gcg ggg cac aat ggc tta 48 
Met He Thr Thr Asp Val Val He He Gly Ala Sly His Asn Gly Leu 
1.5 10 15 

gtc tgt gcd gco Lett ttg ulu octet egg yyc ttg ggg gtg acg tta eta 9G 
Val Cys Ala Ala Tyr Leu Leu Gin Arg Gly Leu Gly Val Thr Leu Leu 
20 25 30 

gaa aag egg gaa gta cca ggg ggg gcg gec acc aca gaa get etc atg 144 
Glu Lys Arg Glu Val Pro Gly Gly Ala Ala Thr Thr Glu Ala Leu Met 
35 40 45 

ccg gag eta tec ccc cag ttt cgc ttt aac cgc tgt gec att gac cac 192 
Pro Gin Trfwi Se>T Pro Gin Phe Arc Phe Asn Arc Cys Ala lie Asp His 
50 55 SO 

gaa ttt ate ttt ctg ggg ccg gtg ttg cag gag eta aat tta gee cag 240 
Glu Phe He Phe Leu Gly Pro Val Leu Gin Glu Leu Asn Leu Ala Gin 
65 70 75 80 

tat ggt ttg gaa tat tta ttt tgt gac ccc agt gtt ttt tgt ccg ggg 288 
Tyr Gly Leu Glu Tyr Leu Phe Cys Asp Pro Ser Val Phe Cys Pro Gly 
85 90 95 

ctg gat ggc caa get ttt atg age tac cgt tec eta gaa aaa acc tgt 336 
Leu Asp Gly Gin Ala Phe Met Ser Tyr Arg Ser Leu Glu Lys Thr Cys 
100 105 110 

gec cac att gee ace tat age ccc cga gat gcg gaa aaa tat egg caa 384 
Ala His He Ala Thr Tyr Ser Pro Arg Asp Ala Glu Lys Tyr Arg Gin 
115 120 125 

ttt gtc aat tat tgg acg gat ttg etc aac get gtc cag cct get ttt 432 
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Phe Val Asn Tyr Trp Thr Asp Leu Leu Asn Ala Val Gin Pro Ala Phe 
130 135 140 

aat get ccg ccc cag get tta eta gat tta gec ctg aac tat ggt tgg 
Asn Ala Pro Pro Gin Ala Leu Leu Asp Leu Ala Leu Asn Tyr Gly Trp 
■145 150 155 160 

gaa aac tta aaa tec gtg ctg gcg ate gee ggg teg aaa acc aag geg 
Glu Arti Leu Lya Sar Val Leu Ala He Ala Gly Ser Lys Thr Lys Ala 
165 170 175 

ttg gat ttt ate cgc act atg ate ggc tec ccg gaa gat gtg etc aat 
Leu Asp Phe He Arg Thr Met He Gly Ser Pro Glu Asp Val Leu Asn 
180 ' 185 . 190 

gaa tgg ttc gac age gaa egg gtt aaa get cct tta get aga eta tgt 
Glu Trp Phe Asp Ser Glu Arg Val Lys Ala Pro Leu Ala Arg Leu Cys 
195 200 205 

teg gaa att ggc get ccc cca tec caa aag ggt agt age tec ggc atg 
Ser Glu He Gly Ala Pro Pro Ser Gin Lys Gly Ser Ser Ser Gly Met 
210 215 220 

atg atg gtg gee atg egg cat ttg gag gga att gee aga cca aaa gga 
Met Met Val Ala Met Arg His Leu Glu Gly He Ala Arg Pro Lys Gly 
225 230 235 240 

ggc act gga gee etc aca' gaa gee ttg gtg aag tta gtg caa gee caa 
Gly Thr Gly Ala Leu Thr Glu Ala Leu Val Lys Leu Val Gin Ala Gin 
245 250 255 

ggg gga aaa ate etc act gac caa acc gtc aaa egg gta ttg gtg gaa 
Gly Gly Lys He Leu Thr Asp Gin Thr Val Lys Arg Val Leu Val Glu 
260 265 270 

aac aac cag gcg ate ggg gtg gag gta get aac gga gaa cag tac egg 
Asn Asa Glu Ala He Gly Val Glu Val Ala to Gly Glu. Gin Tyr arg 
275 280 285 



gee aaa aaa ggc gtg att tct aac ate gat gee cgc cgt tta ttt ttg 
Ala Lys Lys Gly Val He Ser Asn He Asp Ala Arg Arg Leu Phe Leu 
290 295 300 
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caa ttg gtg gaa ccg ggg gcc eta gec aag gtg aat caa aac eta ggg 960 
Gin Leu Val Glu Pro Gly Ala Leu Ma Lys Val Asn Gin Asn Leu Gly 
305 310 315 320 

gaa cga ctg gaa egg cgc act gtg aac aat aac gaa gcc att tta aaa 1008 
Glu Arg Leu Glu Arg Arg Thr Val Asn Asn Asn Glu Ala lie Leu Lys 
325 330 335 

ate gat tgt gcc etc tec ggt tta ccc cac ttc act gcc atg gcc ggg 1056 
He Asp Cys Ala Leu Ser Gly Leu Pro His Phe Thr Ala Met Ala Gly 
340 345 350 

ccg gag gat eta acg gga act att ttg att gcc gac teg gta cgc cat 1104 
Pro Glu Asp Leu Thr Gly Thr He Leu He Ala Asp Ser Val Arg His 
355 360 365 

gtc gag gaa gcc cac gcc etc att gcc ttg ggg caa att ccc gat get 1152 
Val Glu Glu Ala His Ala Leu He Ala Leu Gly Gin He Pro Asp Ala 
370 375 380 

aat ccg tct tta tat ttg gat att ccc act gta ttg gac ccc acc atg 1200 
Asn Pro Ser Leu Tyr Leu Aep He Pro Thr Val Leu Asp Pro Thr Met 
385 390 395 400 

gcc ccc cct ggg cag cac acc etc tgg ate gaa ttt ttt gcc ccc tac 1248 
Ala Pro Pro Gly Gin His Thr Leu Trp He Glu Phe Phe Ala Pro Tyr 
405 410 415 

cgc ate gcc ggg ttg gaa ggg aca ggg tta atg ggc aca ggt tgg acc 1296 
Arg He Ala Gly Leu Glu Gly Thr Gly Leu Met Gly Thr Gly Trp Thr 
420 425 430 

gat gag tta aag gaa aaa gtg gcg gat egg gtg att gat aaa tta acg 1344 
Asp Glu Leu Lys Glu Lys Val Ala Asp Arg Val He Asp Lys Leu Thr 
435 440 445 

gac tat gee cct aac eta aaa tct ctg ate att ggt cgc cga gtg gaa 1392 
Asp Tyr Ala Pro Asn Leu Lys Ser Leu He He Gly Arg Arg Val Glu 
450 455 460 



agt ccc gcc gaa ctg gcc caa egg ctg gga agt tac aac ggc aat gtc 



1440 
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Ser Pro Ala Glu Leu Ala Gin Arg Leu Gly Ser Tyr Asn Gly Asn Val 
465 470 475 480 

tat cat ctg gat atg agt ttg gac caa atg atg ttc etc egg cct eta 
Tyr His Leu Asp Met Ser Leu Asp Gin Met Met Phe Leu Arg Pro Leu 
485 490 495 

ccg gaa att gee aac tac caa acc ccc ate aaa aat ctt tac tta aca 
Pro Glu Tie Ala Asn Tyr Gin Thr Pro lie Lys Asn Leu Tyr Leu Thr 
500 505 510 

ggg gcg ggt acc cat ccc ggt ggc tec ata tea ggt atg ccc ggfc aga 
Gly Ala Gly Thr His Pro Gly Gly Ser lie Ser Sly Met Pro Gly Arg 
515 525 

aat tgc get egg gtc ttt tta aaa caa caa cgt cgt ttt tgg taa 
Asn Cys Ala Arg Val Phe Leu Lys Gin Gin Arg Arg Phe Trp 
530 535 540 



<210> 22 

<211> 542 

■<212> PUT 

<213> Synechocystis sp. 



Met lie Thr Thr Asp Val Val lie lie Gly Ala Gly His Asn Gly Leu 
15 10 15 



Val Cys Ala Ala Tyr Leu Leu Gin Arg Gly Leu Gly Val Thr Leu Leu 



Glu Lys Arg Glu Val Pro Gly Gly Ala Ala Thr Thr Glu Ala Leu Met 



Pro Glu Leu Ser Pro Gin Phe Arg Phe Asn Arg Cys Ala He Asp His 
50 55 60 
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Glu Phe lie Phe Leu Gly Pro Val Leu Gin Glu Leu Asn Leu Ala Gin 
55 70 75 80 



Tyr Gly Leu Glu Tyr Leu Phe Cys Asp Pro Ser Val Phe Cys Pro Gly 
85 90 95 



Leu Asp Gly Gin Ala Phe Met Ser Tyr Arg Ser Leu Glu Lys Thr Cys 
100 105 110 



Ala His lie Ala Thr Tyr ser Pro Arg Asp Ala. Glu Lys Tyr Arg Gin 
115 120 125 



Phe Val Asn Tyr Trp Thr Asp Leu Leu Asn Ala Val Gin Pro Ala Phe 
130 135 140 



Asn Ala Pro Pro Gin Ala Leu Leu Asp Leu Ala Leu Asn Tyr Gly Trp 
145 ISO 155 160 



Glu Asn Leu Lys Ser Val Leu Ala He Ala Gly Ser Lys Thr Lys Ala 
165 170 175 



Leu Asp Phe He Arg Thr Met He Gly Ser Pro Glu Asp Val Leu Asn 
180 185 190 



Glu Trp Phe Asp Ser Glu Arg Val Lys Ala Pro Leu Ala Arg Leu Cys 
195 200 205 



Ser Glu He Gly Ala Pro Pro Ser Gin Lys Gly Ser Ser Ser Gly Met 
210 215 220 



Met Met Val Ala Met Arg His Leu Glu Gly He Ala Arg Pro Lys Gly 
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230 235 
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240 



Gly Thr Gly Ala Leu Thr Glu Ala Leu Val Lys Leu. Val Gin Ala Gin 
245 250 255 



Gly Gly Lys He Leu Thr Asp Gin Thr Val Lys Arg Val Leu Val Glu 
260 265 270 



Asn Asn Gin Ala He Gly Val Glu Val Ala Asn Gly Glu Gin Tyr Arg 
275 280 285 



Ala Lys Lys Gly Val He Ser Asn He Asp Ala Arg Arg Leu Phe Leu 
290 295 300 



Gin Leu Val Glu Pro Gly Ala Leu Ala Lys Val Asn Gin Asn Leu Gly 
305 310 315 320 



Glu Arg Leu Glu Arg Arg Thr Val Asn Asn Asn Glu Ala He Leu Lys 
325 330 335 



He Asp Cys Ala Leu ser Gly Leu Fro His Pfte Thr Ala Met Ala Gly 
340 345 350 



Pro Glu Asp Leu Thr Gly Thr He Leu He Ala Asp Ser Val Arg His 
355 360 365 



Val Glu Glu Ala His Ala Leu He Ala Leu Gly Gin He Pro Asp Ala 
370 375 380 



Asn Pro Ser Leu Tyr Leu Asp He Pro Thr Val Leu Asp Pro Thr Met 
385 390 395 400 
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Ala Pro Pro Gly Gin His Thr Leu Trp lie Glu Phe Phe Ala Pro Tyr 
405 410 415 



Arg lie Ala Gly Leu Glu Gly Stir Gly Leu Met Gly Thr Gly Trp Thr 
420 425 430 

Asp Glu Leu Lys Glu Lys Val Ala Asp Arg Val lie Asp Lys Leu Thr 
435 440 445 

Asp Tyr Ala Pro Asn Leu Lys Ser Leu lie He Gly Arg Arg Val Glu 
450 455 460 

Ser Pro Ala Glu Leu Ala Gin Arg Leu Gly Ser Tyr Asn Gly Asn Val 
465 470 475 480 

Tyr His Leu Asp Met Ser Leu Asp Gin Met Met Phe Leu Arg Pro Lau 
485 490 495 

Pro Glu He Ala Asn Tyr Gin Thr Pro He Lys Asn Leu Tyr Leu Thr 
500 505 510 

Gly Ala Gly Thr His Pro Gly Gly Ser He Ser Gly Met Pro Gly Arg 
515 . 520 525 

Asn Cys Ala Arg Val Phe Leu Lys Gin Gin Arg Arg Phe Trp 
530 535 540 



<210> 23 

<211> 776 

<212> TMh 

<213> Bradyrhizobium sp. 
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<220> 

<221> CDS 

<222> (1)..(774) 

<400> 23 

atg cat gca gca acc gcc aag get act gag ttc ggg gec tct egg cgc 48 
Met His Ala Ala Thr Ala Lys Ala Thr Glu Plie Gly Ala Ser Arg Arg 
15 10 15 

gac gat gcg agg cag cgc cgc gfcc ggt etc acg ctg gcc gcg gfcc ate 96 
Asp Asp Ala Arg Gin Arg Arg Val Gly Leu Thr Leu Ala Ala Val lie 
20 25 30 

ate gcc gcc tgg ctg gtg ctg cat gtc ggt ctg atg ttc ttc tgg ccg 144 
Xle Ala Ala Trp Leu Val Leu His Val Gly Leu Met Phe Phe Trp Pro 
35 40 45 

ctg acc ctt cac age ctg ctg ccg get ttg cct ctg gtg gtg ctg cag 192 
Leu Thr Leu His Ser Leu Leu Pro Ala Leu Pro Leu Val Val Leu Gin 
50 55 60 

acc tgg etc tat gta ggc ctg ttc ate ate gcg cat gac tgc atg cac 240 
Thr Trp Leu Tyr Val Gly Leu Phe lie lie Ala His Asp Cys Met His 
65 70 75 . 80 

ggc teg ccg gtg ccg ttc aag ccg cag gtc aac cgc cgt ate gga cag 288 
Gly Ser Leu Val Pro Phe Lys pro Gin Val Asn Arg Arg lie Gly Gin 
85 90 95 

etc tgc ctg ttc etc tat gcc ggg ttc tec ttc gac get etc aat gtc 336 
Leu Cys Leu Phe Leu Tyr Ala Gly Phe Ser Phe Asp Ala Leu Asn Val 
100 105 . 110 

gag cac cac aag cat cac ego cat cce ggc acg gcc gag gat ccc gat 384 
Glu His His Lys His His Arg His Pro Gly Thr Ala Glu Asp Pro Asp 
115 120 125 

ttc gac gag gtg ccg ccg cac ggc ttc tgg cac tgg ttc gcc age ttt 432 
Phe Asp Glu Val Pro Pro His Gly Phe Trp His Trp Phe Ala Ser Phe 
130 135 140 
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ttc ctg cac tat ttc ggc tgg aag cag gtc gcg ate ate gca gee gtc 
Phe Leu His Tyr Phe Gly Trp Lys Gin Val Ala lie He Ala Ala Val 
145 150 155 160 

teg ctg gtt tat cag etc gtc ttc gee gtt ccc ttg cag aac ate ctg 
Ser Leu Val Tyr Gin Leu Val Phe Ala Val Pro Leu Gin Asn He Leu 
165 170 175 

ctg ttc tgg gcg ctg ccc ggg ctg ctg teg gcg ctg cag ctg ttc acc 
Leu Phe Trp Ala Leu Pro Gly Leu Leu Ser Ala Leu Gin Leu Phe Thr 
180 185 190 

ttc ggc acc tat ctg ccg cac aag ccg gec acg cag ccc ttc gec gat 
Phe Gly Thr Tyr Leu Pro His Lys Pro Ala Thr Gin Pro Phe Ala Asp 
195 200 205 

cgc cac aac gcg egg acg age gaa ttt ccc gcg tgg ctg teg ctg ctg 
Arg His Asn Ala Arg Thr Ser Glu Phe Pro Ala Trp Leu Ser Leu Leu 
210 215 220 

acc tgc ttc cac ttc ggc ttt cat cac gag cat cat ctg cat ccc gat 
Thr Cys Phe His Phe Gly Phe His His Glu His His Leu His Pro Asp 
225 230 235 240 

gcg ccg tgg tgg egg ctg ccg gag ate aag egg egg gee ctg gaa agg 
Ala Pro Trp Trp Arg Leu Pro Glu He Lys Arg Arg Ala Leu Glu Arg 
245 250 255 

cgt gac ta 
Arg Asp 



<210> 24 

<211> 258 

<212> PRT 

<213> Bradyrhizobium sp. 

<400> 24 



Met His Ala Ala Thr Ala Lys Ala Thr Glu Phe Gly Ala Ser Arg Arg 
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15 10 15 

Asp Asp Ala Arg Gin Arg Arg Val Gly Leu Thr Leu Ala Ala Val lie 
20 25 30 



lie Ala Ala Trp Leu Val Leu His Val Gly Leu Met Phe Phe Trp Pro 
35 40 45 



Leu Thr Leu His Ser Leu Leu Pro Ala Leu Pro Leu Val Val Leu Gin 
50 55 60 



Thr Trp Leu Tyr Val Gly Leu Phe He He Ala His Asp Cys Met His 
65 70 75 80 



Gly Ser Leu Val Pro Phe Lys Pro Gin Val Asn Arg Arg He Gly Gin 
85 90 95 



Leu Cys Leu Phe Leu Tyr Ala Gly Phe Ser Phe Asp Ala Leu Asn Val 
100 105 110 



Glu His His Lys His His Arg His Pro Gly U'nr Ala Glu Asp Pro Asp 
115 120 125 



Phe Asp Glu Val Pro Pro His Gly Phe Trp His Trp Phe Ala Ser Phe 
130 135 140 



Phe Leu His Tyr Phe Gly Trp Lys Gin Val Ala He He Ala Ala Val 
145 150 155 ' 160 



Ser Leu Val Tyr Gin Leu Val Phe Ala Val Pro Leu Gin Asn He Leu 
165 170 175 
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Leu Phe Trp Ala Leu Pro Gly Leu Leu Ser Ala Leu Gin Leu Phe Thr 
180 185 190 



Phe Gly Thr Tyr Leu Pro His Lys Pro Ala Thr Gin Pro Phe Ala Asp 
195 200 205 



Arg His Asn Ala Arg Thr Ser Glu Phe Pro Ala Trp Leu Ser Leu Leu 
210 215 220 



Thr Cys Phe His Phe Gly Phe His His Glu His His Leu His Pro Asp 
225 230 235 240 



Ala Pro Trp Trp Arg Leu Pro Glu lie Lys Arg Arg Ala Leu Glu Arg 
245 250 255 



Arg Asp 



<210> 25 

<211> 777 

<212> UNA 

<213> Nostoc Sp. 



<220> 

<221> CDS 

<222> (1}..{777) 

<400> 25 

atg gtt cag CgC caa cca tea tut ctg cat tea. gaa ooa otg gtg fcta. 48 
Met Val Gin Cys Gin Pro Ser Ser Leu His Ser Glu Lys Leu Val Leu 
1.5 10 15 

ttg tea teg aca ate aga gat gat aaa aat att aat aag ggt ata ttt 96 
Leu Ser Ser Thr lie Arg Asp Asp Lys Asn lie Asn Lys Gly He Phe 
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20 25 30 

afct gcc tgc fctt ate tta ttt tta tgg gca att agt tta ate tta tta 144 
lie Ala Cys Phe He Leu Phe Leu Trp Ala lie Ser Leu He Leu Leu 
35 40 45 

etc tea ata gat aca tee ata att cat aag age tta tta ggt ata gcc 192 
Leu Ser He Asp Thr Ser He He His Lys Ser Leu Leu Gly He Ala 
so 55 fin 

atg ctt tgg cag ace ttc tta tat aca ggt tta ttt att act get cat 240 
Met Leu Trp Gin Thr Phe Leu Tyr Thr Gly Leu Phe He Thr Ala His 
65 70 75 80 

gat gcc atg cac ggc gta gtt tat ccc aaa aat ccc aga ata aat aat 288 
Asp Ala Met His Gly Val Val Tyr Pro Lys Asn Pro Arg He Asn Asn 
85 90 95 

ttt ata ggt aag etc act eta ate ttg tat gga eta etc cct tat aaa 336 
Phe He Gly Lys Leu Thr Leu He Leu Tyr Gly Leu Leu Pro Tyr Lys 
100 105 110 

gat tta ttg aaa aaa cat fcgg tta cac cac gga cat cct ggt act gat 384 
Asp Leu Leu Lys Lys His Trp Leu His His Gly His Pro Gly Thr Asp 
115 120 125 

tta gaccct gat tat tac aat ggt cat ccc caa aac ttc ttt ctt tgg 432 
Leu Asp Pro Asp Tyr Tyr Asn Gly His Pro Gin Asn Phe Phe Leu Trp 
130 135 140 

tat eta cat ttt atg aag tct tat tgg cga tgg acg caa att ttc gga 480 
Tyr Leu His. Phe Met Lys Ser Tyr Trp Arg Trp Thr Gin He Phe Gly 
145 150 155 160 

tta gtg atg att ttt cat gga ctt aaa aat ctg gtg cat ata cca gaa 528 
Leu Val Met He Phe His Gly Leu Lys Asn Leu Val His He Pro Glu 
165 170 175 

aat aat tta att ata ttt tgg atg ata cct tct att tta agt tea gta 576 
Asn Asn Leu He He Phe Trp Met He Pro Ser He Leu Ser Ser Val 
180 185 190 
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caa eta ttt tat ttt ggt aca ttt ttg cct cat aaa aag eta gaa ggt 62 < 

Gin Leu Phe Tyr Phe Gly Thr Phe Leu Pro His Lys Lys Leu Glu Gly 
195 200 205 

ggt tat act aac ccc cat tgt gcg cgc agt ate cca tta cct ctt ttt 67: 
Gly Tyr Thr Asn Pro His Cys Ala Arg Ser He Pro Leu Pro Leu Phe 
210 215 220 

tgg tct ttt crtt act tgt tat cac ttc ggc tac cac aag gaa cat cac 72 
Trp Ser Phe Val Thr Cys Tyr His Phe Gly Tyr His Lys Glu His His 
225 230 235 240 

gaa tac cct caa ctt cct tgg tgg aaa tta cct gaa get cac aaa ata 76 
Glu Tyr fro Gin Leu Pro Tip Trp Lys Leu Pro Glu Ala Hits Lyes lis 
245 250 255 

tct tta taa 77 
Ser Leu 



<210> 26 

<211> 258 

<212> PRT 

<213> Nostoc sp. 

<400> 26 

Met Val Gin Cys Gin Pro Ser Ser Leu His Ser Glu Lys Leu Val Leu 
15 10 15 



Leu Ser Ser Thr He Arg Asp Asp Lys Asn He Asn Lys Gly He Phe 



He Ala Cys Phe He Leu PL© Leu Trp Ala He Ser Lsu He Leu Leu 



Leu Ser He Asp Thr Ser He He His Lys Ser Leu Leu Gly He Ala 
50 55 60 
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Met Leu Tip Gin Thr Phe Leu Tyr Thr Gly Leu Pite He Thr Ala His 
65 70 75 80 



Asp Ala Met His Gly Val Val Tyr Pro Lys Asn Pro Arg He Asn Asn 



Phe He Gly Lys Leu Thr Leu He Leu Tyr Gly Leu Leu Pro Tyr Lys 
100 105 110 



Asp Leu Leu Lys Lys His Trp Leu His His Gly His Pro Gly Thr Asp 
115 120 125 



Leu Asp Pro Asp Tyr Tyr Asn. Gly His Pro Gin Asn Phe Phe Leu Trp 
130 135 140 



Tyr Leu His Phe Met Lvs Ser Tyr Trp Arg Trp Thr Gin He Phe Gly 
145 150 155 160 



Leu Val Met He Phe His Gly Leu Lys Asn Leu Val His He Pro Glu 
165 170 175 



Asn Asn Leu He He Phe Trp Met lie Pro Ser He Leu Ser Ser Val 
180 185 190 



Gin Leu Phe Tyr Phe Gly Thr Phe Leu Pro His Lys Lys Leu Glu Gly 
195 200 205 



Gly Tyr Thr Asn Pro His Cys Ala Arg Ser He Pro Leu Pro Leu Phe 
210 215 220 
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Trp Ser Phe Val Thr Cys Tyr His Phe Gly Tyr His Lys Glu His His 
225 230 235 240 



Glu Tyr Pro Gin Leu Pro Trp Trp Lys Leu Pro Glu Ala His Lys lie 
245 250 255 



<210> 27 

<211> 789 

<212> DNA 

<213> Nostoc punctiforme 



<220> 

<221> CDS 

<222> <1)..(789) 



-=400> 27 

ttg aat ttt tgt gat aaa cca gtt age fcat tat gtt gca ata gag caa 
Leu Asn Phe Cys Asp Lys Pro Val Ser Tyr Tyr Val Ala He Glu Gin 
15 10 15 

tta agt get aaa gaa gat act gtt tgg ggg ctg gtg att gtc ata gta 
Leu Ser Ala Lys Glu Asp Thr Val Trp Gly Leu Val He Val He Val 



att att agt ctt tgg gta get agt ttg get ttt tta eta get att aat 144 
He He Ser Leu Trp Val Ala Ser Leu Ala Phe Leu Leu Ala He Asn 
35 40 45 

tat gec aaa gtc cca att tgg ttg ata cct att gca afca gtt tgg caa 192 
Tyr Ala Lys Val Pro lie Trp lieu Xle Pro He Ala He Val Trp Gin 



atg ttc ctt tat aca ggg eta ttt att act gca cat gat get atg cat 
Met Phe Leu Tyr Thr Gly Leu Phe He Thr Ala His Asp Ala Met His 



240 
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ggg tea gtt tat cgt aaa aat ccc aaa att aat aat ttt ate ggt tea 
Gly Ser Val Tyr Arg Lys Asn Pro Lys He Asn Asn Phe He Gly Ser 



eta get gta gcg ctt tac get gtg ttt cca tat caa cag atg tta aag 
Leu Ala Val Ala Leu Tyr Ala Val Phe Pro Tyr Gin Gin Met Leu Lys 
100 105 110 

aat cat tgc tta cat cat cgt cat cct get age gaa gtt gac cca gat 
Asn His Cys Leu His His Arg His Pro Ala Ser Glu Val Asp Pro Asp ' 
115 120 125 

ttt cat gat ggt aag aga aca aac get <*tt Ltc tgtr tat etc cat ttc 
Phe His Asp Gly Lys Arg Thr Asn Ala He Phe Trp Tyr Leu His Phe 
130 135 140 

atg ata gaa tac tec agt tgg caa cag tta ata gta eta act ate eta 
Met He Glu Tyr Ser Ser Trp Gin Gin Leu He Val Leu Thr He Leu 
145 150 155 ISO 

ttt aat tta get aaa tac gtt ttg cac ate cat caa ata aat etc ate 
Phe Asia Lou Ala Lys Tyr Val Leu His He His Gin He Asn Leu He 
165 170 175 

tta ttt tgg agt att cct cca att tta agt tec att caa ctg ttt tat 
■ Leu Phe Trp Ser He Pro Pro He Leu Ser Ser He Gin Leu Phe Tyr 
180 185 190 

ttc gga aca ttt ttg cct cat cga gaa ccc aag aaa gga tat gtt tat 
Phe Gly Thr Phe Leu Pro His Arg Glu Pro Lys Lys Gly Tyr Val Tyr 
195 200 - 205 

ccc cat tgc age caa aca ata aaa ttg cca act ttt ttg tea ttt ate 
Pro His Cys Ser Gin Thr He Lys Leu Pro Thr Phe Leu Ser Phe He 
210 , 215 220 

get tgc tac cac ttt ggt tat cat gaa gaa cat cat gag tat ccc cat 
Ala Cys Tyr His Phe Gly Tyr His Glu Glu His His Glu Tyr Pro His 
225 230 235 240 



gta cct tgg tgg caa ctt cca tct gta tat aag cag aga gta ttc aac 



768 
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Val Pro Trp Trp Gin Leu Pro Ser Val Tyr Lys Gin Arg Val Phe Asn 
245 250 255 

aat tea gta acc aat teg taa 78£ 
Asn Ser Val Thr Asn Ser 
260 



<210>- 28 

<211> 262 

<212> PRT 

<213> Nostoc punctiforme 



Leu Asn Phe Cys Asp Lys Pro Val Ser Tyr Tyr Val Ala He Glu Gin 
15 10 15 



Leu Ser Ala Lys 



Glu Asp Thr Val Trp Gly Leu Val He Val He Val 



He He Ser Leu Trp Val Ala Ser Leu Ala Phe Leu Leu Ala He Asn 
35 40 45 



Tyr Ala Lys Val Pro He Trp Leu He Pro He Ala He Val Trp Gin 
50 55 50 



Met Phe Leu Tyr Thr Gly Leu Phe He Thr Ala His Asp Ala Met His 
65 70 75 80 



Gly Ser Val Tyr Arg Lys Asn Pro Lys He Asn Asn Phe He Gly Ser 



Leu Ala Val Ala Leu Tyr Ala Val Phe Pro Tyr Gin Gin Met Leu Lys 
100 105 • HO 
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Asn His Cys Leu His His Arg His Pro Ala Ser Glu Val Asp Pro Asp 
115 120 125 



Piie His Asp Gly Lys Arg Thr Asn Ala He Phe Trp Tyr Leu His Phe 
130 135 140 



Met He Glu Tyr Ser Ser Trp Gin Gin Leu He Val Leu Thr lie Leu 
145 150 155. 160 



Phe Asn Leu Ala Lys Tyr Val Leu His He His Gin He aau Leu He 
165 170 175 



Leu Phe Trp Ser He Pro Pro He Leu Ser Ser He Gin Leu Phe Tyr 
180 185 190 



Phe Gly Thr Phe Leu Pro His Arg Glu Pro Lys Lys Gly Tyr Val Tyr 
195 200 205 



Pro His Cys Ser Gin Thr He Lys Leu Pro Thr Phe Leu Ser Phe He 
210 215 220 



Ala Cys Tyr His Phe Gly Tyr His Glu' Glu His His Glu Tyr Pro His 
225 230 235 240 



Val Pro Trp Trp Gin Leu Pro Ser Val Tyr Lys Gin Arg Val Phe Asn 
245 250 255 



Asn Ser Val Thr Asn ! 

260 
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<211> 762 
<212> DNA 

<213> Nostoc puncti forme 



<220> 

<221> CDS 

<222> (1)..(762) 

<400> 29 

gtg ate cag tta gaa caa cca etc agt cat caa gca aaa ctg act cca 
Val He Gin Leu Glu Gin Pro Leu Ser His Gin Ala Lys Leu Thr Pro 
15 10 15 

gta ctg aga agt aaa tct cag ttt aag ggg ctt ttc att get att gtc 
Val Leu Arg Ser Lys Ser Gin Phe Lys Gly Leu Phe He Ala He Val 



att gtt age gca tgg gtc att age ctg agt tta tta ctt tec ctt gac 
He Val Ser Ala Trp Val He Ser Leu Ser Leu Leu Leu Ser Leu Asp 



ate tea aag eta. aaa ttt tgg atg tta ttg act gtt ata eta tgg caa 
He Ser Lys Leu Lys Phe Trp Met Leu Leu Pro Val He Leu Trp Gin 



aca ttt tta tat acg gga tta ttt att aca tct cat gat gec atg cat 
Thr Phe Leu Tyr Thr Gly Leu Phe He Thr Ser His Asp Ala Met His 



ggc gta gta ttt ccc caa aac acc aag att aat cat ttg att gga aca 
Gly Val Val Phe Pro Gin Asn Thr Lys He Asn His Leu He Gly Thr 
85 90 95 

ttg acc eta tec ctt tat ggt ctt tta cca tat caa aaa eta ttg aaa 
Leu Thr Leu Ser Leu Tyr Gly Leu Leu Pro Tyr Gin Lys Leu Leu Lys 
loo 105 110 

aaa cat tgg tta cac cac cac aat cca gca age tea ata gac ccg gat 
Lys His Trp Leu His His His Asn Pro Ala Ser Ser He Asp Pro Asp 
115 120 125 
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ttt cac aat ggt aaa cac caa agt ttc ttt gcfc tgg tat ttt cat ttt 432 
Phe His Asn Gly Lys His Sin Ser Phe Phe Ala Trp Tyr Phe His Phe 
130 135 140 

atg aaa ggt tac tgg agt tgg ggg caa ata att gcg ttg act att att . 480 
Met Lys Gly Tyr Trp Ser Trp Gly Gin lie He Ala Leu Thr He He 
145 150 155 160 

fcafc. aac ttt get aaa tac ata nt.e nafc atic cca act gat aat eta act 528 
Tyr Asn Phe Ala Lys Tyr He Leu His He Pro Ser Asp Asn Leu Thr 
165 170 175 

tac ttt tgg gtg eta ccc teg ctt tta agt tea tta caa tta ttc tat 576 
Tyr Phe Trp Val Leu Pro Ser Leu Leu Ser Ser Leu Gin Leu Phe Tyr 
180 185 190 

ttt ggt act ttt tta ccc cat agt gaa cca ata ggg ggt tat gtt cag 624 
Phe Gly Thr Phe Leu Pro His Ser Glu Pro He Gly Gly Tyr Val Gin 
195 200 205 

cct cat tgt gec caa aca att age cgt cct att tgg tgg tea ttt ate 672 
Pro His Cys Ala Gin Thr He Ser Arg Pro He Trp Trp Ser Phe He 
210 215 220 

acg tgc tat cat ttt ggc tac cac gag gaa cat cac gaa tat cct cat 720 
Thr Cys Tyr His Phe Gly Tyr His Glu Glu His His Glu Tyr Pro His 
225 230 235 240 

att tct tgg tgg cag tta cca gaa att tac aaa gca aaa tag 762 
lie -Ser Trp Trp Gin Leu Pro Glu He Tyr Lys Ala Lys 
245 250 



<210> 30 

<211> 253 

<212> PUT 

<213> wostoc punctiforiue 

<400> 30 



Val He Gin Leu Glu Gin Pro Leu Ser His Glri Ala Lys Leu Thr Pro 
15 10 15 
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Val Leu Arg Ser Lys Ser Gin Phe Lys Gly Leu Phe lie Ala lie Val 



lie Val Ser Ala Trp Val lie Ser Leu Ser Leu Leu Leu Ser Leu Asp 



He Ser Lys Leu Lys Phe Trp Met Leu Leu Pro Val He Leu Trp Gin 



Thr Phe Leu Tyr Thr Gly Leu Phe He Thr Ser His Asp Ala Met His 



Gly Val Val Phe Pro Gin Asn Thr Lys He Asn His Leu He Gly Thr 
85 90 95 



Leu Thr Leu Ser Leu Tyr Gly Leu Lou Pro Tyr Gin Lys Leu Leu Lys 
100 105 110 



Lys His Trp Leu His His His Asn Pro Ala Ser Ser He Asp Pro Asp 
115 120 125 



Phe His Asn Gly Lys His Gin Ser Phe Phe Ala Trp Tyr Phe His Phe 
130 135 140 



Met Lys Gly Tyr Trp Ser Trp Gly Gin ' He He Ala Leu Thr He He 
145 150 155 160 



Tyr Asn Phe Ala Lys Tyr He Leu His He Pro Ser Asp Asn Leu Thr 
165 170 175 
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Tyr Phe Trp Val Leu Pro Ser Leu Leu Ser Ser Leu Glix Leu Phe Tyr 
180 185 190 



Phe Sly Thr Phe Leu Pro His Ser Glu Pro He Gly Gly Tyr Val Gin 
195 200 205 



Pro His Cys Al « Gin Thr He S&r Arg- Pro He Trp Trp Ser Phe He 
210 215 220 



Thr Cys Tyr His Phe Gly Tyr His Glu Glu His His Glu Tyr Pro His 
225 230 23b 240 



He Ser Trp Trp Gin Leu Pro Glu He Tyr Lys Ala Lys 
245 250 



<210> 31 

<211> 1608 

<212> D£JA 

<213> Haematococcus pluvialis 



<220> 

<221> CDS 

<222> (3).. (971) 

<400> 31 

ct aca ttt cac aag ccc gtg age ggt gca age get ctg ccc cac ate 47 
Thr Phe His Lys Pro Val Ser Gly Ala Ser Ala Leu Pro His He 
15 10 15 

ggc cca cct cct cat etc cat egg tea ttt get get acc acg atg ctg 95 
Gly Pro Pro Pro His Leu His Aarg Sear Phe Ala Ala Thr Thxr Met Leu 
20 25 30 

teg aag ctg cag tea ate age gtc aag gee cgc cgc gfct gaa eta gec 143 
Ser Lys Leu Gin Ser He Ser Val Lys Ala Arg Arg Val Glu Leu Ala 
35 40 45 
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cgc gac ate acg egg ccc aaa gtc tgc ctg cat get cag egg tgc teg 
Arg Asp lie Thr Arg Pro Lys Val Cys Leu His Ala Gin Arg Cys Ser 
50 55 60 

tta gtt egg ctg cga gtg gca gca cca cag aca gag gag gcg ctg gga 
Leu Val Arg Leu Arg Val Ala Ala Pro Gin Thr Glu Glu Ala Leu Gly 



aec gtg cag get gec ggc gcg ggc gat gag cac age gec gat gta gca 
Thr Val Gin Ala Ala Gly Ala Gly Asp Glu His Ser Ala Asp Val Ala 
80 85 90 95 

etc cag cag ctt gac egg get ate gca gag cgt cgt gec egg cgc aaa 
Leu Gin Gin Leu Asp Arg Ala lie Ala Glu Arg Arg Ala Arg Arg Lys 
100 105 HO 

egg gag cag ctg tea tac cag get gec gec att gca gca tea att ggc 
Arg Glu Gin Leu Ser Tyr Gin Ala Ala Ala lie Ala Ala Ser He Gly 
115 120 125 

' gtg tea ggc att gee ate ttc gec aec tac ctg aga ttt gec atg cac 
val Ser Gly lie Ala. lie Phe Ala Thr Tyr Leu Arg Phe Ala Met His 
130 135 ' 140 

atg acc gtg ggc ggc gca gtg cca tgg ggt gaa gtg get ggc act etc 
Met Thr Val Gly Gly Ala Val. Pro Trp Gly Glu Val Ala Gly Thr Leu 
145 150 155 

etc ttg gtg gtt ggt ggc gcg etc ggc atg gag atg tat gec cgc tat 
Leu Leu Val Val Gly Gly Ala Leu Gly Met Glu Met Tyr Ala Arg Tyr 
160 165 170 175 

gca cac aaa gee ate tgg cat gag teg cct ctg ggc tgg ctg ctg cac 
Ala His Lys Ala He Trp His Glu Ser Pro Leu Gly Trp Leu Leu His 
180 185 190 

aag age cac cac aca cct cgc act gga ccc ttt gaa gec aac gac ttg 
Lys Ser His His Thr Pro Arg Thr Gly Pro Phe Glu Ala Asn Asp Leu 
195 200 205 

ttt gca ate ate aat gga ctg ccc gec atg etc ctg tgt acc ttt ggc 
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Phe Ala He He Asn Gly Leu Pro Ala Met Leu Leu Cys Thr Phe Gly 
210 215 220 

ttc tgg ctg ccc aac gtc ctg ggg gcg gcc tgc ttt gga gcg ggg ctg 71 
Phe Trp Leu Pro Asn Val Leu Gly Ala Ala Cys Phe Gly Ala Gly Leu 
225 230 235 

ggc ate acg eta tac ggc atg gca tat atg ttt gta cac gat ggc ctg 76 
Gly lie Thr Leu Tyr Gly Met Ala Tyr Met Phe Val His Asp Gly Leu 
240 245 250 255 

gtg cac' agg cgc ttt ccc acc ggg ccc ate get ggc ctg ccc tac atg 81 
Val His Arg Arg Phe Pro Thr Gly Pro He Ala Gly Leu Pro Tyr Met 
260 265 270 



aag cgc ctg aca gtg gcc cac cag 



eta cac cac age ggc aag tac ggt 



Lys Arg Leu Thr Val Ala His Gin Leu His His Ser Gly Lys Tyr Gly 
275 280 285 

ggc gcg ccc tgg ggt atg ttc ttg ggt cca cag gag ctg cag cac att 911 
Gly Ala Pro Trp Gly Met Phe Leu Gly Pro Gin Glu Leu Gin His He 
290 295 300 

cca ggt gcg gcg gag gag gtg gag cga ctg gtc ctg gaa ctg gac tgg 959 
Pro Gly Ala Ala Glu Glu Val Glu Arg Leu Val Leu Glu Leu Asp Trp 
305 310 315 

tec aag egg tag ggtgcggaac caggcacgct ggtttcacac ctcatgcctg 1011 

Ser Lys Arg 

320 

tgataaggtg tagctagagc gatgcgtgtg agaegggfcat gtcaeggteg actggtctga 1071 

tggccaatgg catcggccat gtctggtcat caegggctgg ttgcctgggt gaaggtgatg 1131 

cacatcatca tgtgcggttg gaggggctgg cacagtgtgg gctgaactgg agcagttgtc 1191 

caggctggcg ttgaatcagt gagggtttgt gattggcggt tgtgaagcaa tgactccgcc 1251 

catattctat ttgtgggagc tgagatgatg geatgettgg gatgtgcatg gatcatggta 1311 

gtgcagcaaa ctatattcac ctagggctgt tggtaggatc aggtgaggee ttgcacattg 1371 
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catgatgtac tcgtcatggt gtgttggtga gaggatggat gtggatggat gfcgtattctc 1431 
agacgtagac cttgactgga ggcttgatcg agagagtggg ccgtattctt tgagagggga 1491 
ggctcgtgcc agaaatggtg agtggatgac tgtgacgctg tacattgcag gcaggtgaga 1551 
tgcactgtct cgattgtaaa atacattcag atgcaaaaaa ; 



<210> 32 

<211> 322 

<212> PRT 

<213> Haematococcus pluvial is 



Thr Phe His Lys Pro Val Ser Gly Ala Ser Ala Leu Pro His He Gly 



Pro Pro Pro His Leu His Arg Ser Phe Ala Ala Thr Thr Met Leu Ser 



Lys Leu Gin Ser He Ser Val Lys Ala Arg Arg Val Glu Leu Ala Arg 
35 40 45 



Asp He Thr Arg Pro Lys Val Cys Leu His Ala Gin Arg Cys Ser Leu 



Val Arg Leu Arg Val Ala Ala Pro Gin Thr Glu Glu Ala Leu Gly Thr 
65 70 75 80 



Val Gin Ala Ala Gly Ala Gly Asp Glu His Ser Ala Asp Val Ala Leu 
85 90 95 



Gin Gin Leu Asp Arg Ala He Ala Glu Arg Arg Ala Arg Arg Lys Arg 
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100 



76/358 
105 



PCT/EP20O4/O0010O 

110 



Glu Gin Leu Ser Tyr Gin Ala Ala Ala lie Ala Ala Ser lie Gly Val 
115 120 125 



• Gly He Ala He Phe Ala Thr Tyr Leu Arg Phe Ala Met His Met 
130 135 140 



Thr Val Gly Gly Ala Val Pro Trp Gly Glu Val Ala Gly Thr Leu Leu 
145 150 ■ 155 160 



Leu Val Val Gly Gly Ala Leu Gly Met Glu Met Tyr Ala Arg Tyr Ala 
165 170 175 



His Lys Ala He Trp His Glu Ser Pro Leu Gly Trp Leu Leu His Lys 
180 185 190 



■ His His Thr Pro Arg Thr Gly Pro Phe Glu Ala Asn Asp Leu Phe 
195 200 205 



Ala He He Asn Gly Leu Pro Ala Met beu Leu cys Thr Phe Gly Phe 
210 215 220 



Trp Leu Pro Asn Val Leu Gly Ala Ala Cys Phe Gly Ala Gly Leu Gly 
225 230 235 240 



He Thr Leu Tyr Gly Met Ala Tyr Met Phe Val His Asp Gly Leu Val 
' 245 250 255 



His Arg Arg Phe Pro Thr Gly Pro He Ala Gly Leu Pro Tyr Met Lys 
260 265 270 
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Arg Leu Thr Val Ala His Gin Leu His His Ser Gly Lys Tyr Gly Gly 
275 280 285 



Ala Pro Trp Gly Met Phe Leu Gly Pro Gin Glu Leu Gin His He Pro 
290 295 300 



Gly Ala Ala Glu Glu Val Glu Arg Leu Val Leu Glu Leu Asp Trp Ser 
305 310 315 320 



<210> 33 

<211> 528 

<212> DNA 

<213> Erwinia uredovora 



<220> 

<221> CDS 

<222> CD • • (528) 



<400> 33 

atg ttg tgg att tgg aat gcc ctg ate gtt ttc gtt acc gtg att ggc 

Met Leu Trp lie Trp Asn Ala Leu He Val Phe Val Thr Val He Gly 
15 10 15 

atg gaa gtg att get gca ctg gca cac aaa tac ate atg cac ggc tgg 
Met Glu Val He Ala Ala Leu Ala His Lys Tyr He Met His Gly Trp 



ggt tgg gga tgg cat Ctt tea. cat cat gaa. ccg cgt aaa ggt gcg fctt 
Gly Trp Gly Trp His Leu Ser His His Glu Pro Arg Lys Gly Ala Phe 



gaa gtt aac gat ctt tat gcc gtg gtt ttt get gca tta teg ate ctg 
Glu Val Asn Asp Leu Tyr Ala Val Val Phe Ala Ala Leu Ser He Leu 



192 
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ctg att tat ctg ggc agt aca gga atg tgg ccg etc cag tgg att ggc 240 
Leu lie Tyr Leu Gly Ser Thr Gly Met Trp Pro Leu Gin Tip He Gly 
65 70 75 80 



gca ggt atg acg gcg tat gga tta etc tat ttt atg gtg cac gac ggg 288 
Ala Gly Met Thr Ala Tyr Gly Leu Leu Tyr Phe Met Val His Asp Gly 
85 90 95 



ctg gtg cat caa cgt tgg cca ttc cgc tat att cca cgc aag ggc tac 336 
Leu Val His Gin Arg Trp Pro Phe Arg Tyr He Pro Arg Lys Gly Tyr 
100 105 110 

etc aaa egg ttg tat atg gcg cac cgt atg cat cac gec gtc agg ggc 384 
Leu Lys Arg Leu Tyr Met Ala His Arg Met His His Ala Val Arg Gly 
115 120 125 

aaa gaa ggt tgt gtt tct ttt ggc ttc etc tat gcg ccg ccc ctg tea 432 
Lys Glu Gly Cys Val Ser Phe Gly Phe Leu Tyr Ala Pro Pro Leu Ser 
130 135 140 



aaa ctt cag gag aog ata egg gaa aga eat ggc get aga gcg ggc get 
Lys Leu Gin Ala Thr Leu Arg Glu Arg His Gly Ala Arg Ala Gly Ala 
145 150 155 160 



gec aga gat gcg cag ggc ggg gag gat gag ccc gca tec ggg aag taa 528 
Ala Arg Asp Ala Gin Gly Gly Glu Asp Glu Pro Ala Ser Gly Lys 
165 170 175 



<210> 34 

<311> 175 

<212> PRT 

<213> Erwinia uredovora 



<400> 34 



Met Leu Trp He Trp Asn Ala Leu He Val Phe Val Thr Val 
15 10 



He Gly 
15 
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Met Glu Val lie Ala Ala Leu Ala His Lys Tyr lie Met His Gly Trp 
20 25 30 



Gly Trp Gly Trp His Leu Ser His His Glu Pro Arg Lys Gly Ala Phe 
35 40 45 



Glu Val Asn Asp Leu Tyr Ala Val Val Phe Ala Ala Leu Ser He Leu 



Leu He Tyr Leu Gly Ser Thr Gly Met Trp Pro Leu Gin Trp He Gly 



Ala Gly Met Thr Ala Tyr Gly Leu Leu Tyr Phe Met Val His Asp Gly 



Leu Val His Gin Arg Trp Pro Phe Arg Tyr He Pro Arg Lys Gly Tyr 
100 105 110 



Leu Lys Arg Leu Tyr Met Ala His Arg Met His His Ala Val Arg Gly 
115 120 125 



Lys Glu Gly Cys Val Ser Phe Gly Phe Leu Tyr Ala Pro Pro Leu Ser 
130 135 140 



L,ys Leu Gin Ala Thr Leu Arg Glu Arg His Gly Ala Arg Ala Gly Ala 
145 150 155 160 



Ala Arg Asp Ala Gin Gly Gly Glu Asp Glu Pro Ala Ser Gly Lys 
155 170 175 



<210> 35 
<211> 1520 
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<212> DNA 

<213> Artificial 

<220> 

<223> Promotor 
<400> 35 

ctcgagtacc gaggcggaac ggcaggaatg tttccctcfcc ttttagaggg caafctcttta 60 

tccaatgtca tgfctgatgct agatafcttct gtctcttata ataaggcgaa tacccatttt 120 

tgaattgaag ttgagataaa aaaaaagggg gcccaatttg tcaacgccaa agagtcaagc 180 

tttttctttg gctttagccg aacaatctaa gacttattgt ttttgaagafc atttgacctt 240 

ttctagatat tccttcaagt aaagcttttt tcgagttttt tttttttttc bttgtgaagg 300 

atttattgtt attggtatcc attttttatt ggaagacaag ataagttaat attgattttg 3 60 

cttaaagatt aaaaggaaat cagaaaacga caataaaaaa tgtaacggac aaactatggt 420 

gtcgattata agtctaaatc cttaaaaaa't gacaacgagt tgctttcctc tgaaaacaat 480 

tcfctttgtct ttgcaagaaa ggtttctttt ttgtttgctt gcattactta aacatcaaat 540 

caaatgaaag gaataaagca gatttgaggg cgaataagga ttttctggtc aacaagatgt 600 

gagtgacacc taaggaacta aatgccattc atttgtttta aaacgacabc aaagattgat 660 

gatcaacagg attgagagag agaaaaagaa ctcgtgtcat ttatttctgt tgactgaaat 720 

tttatattta gaaaaaatgt caaatctata gctttagcta tattacataa catttgaaat 780 

aataataata aaaaaagaca cattagagac acttttcaaa ctctaaataa ctgtctataa 840 

acacaaagaa aacaaagacc tctataacaa cttattagat ttttctcgta cttttgtcta 900 

aagatgatgt attcttgtta tcccacactt ctfctcatttg ttcttgatgc tactaaatat 960 

acaaaatttc ttttttgcaa gagatattat tccaaaaatt ttcaaaaaga aatttttttc 1020 

acaatagcag ttgatcgtgt aacccaaaga ggttctttgt tattttgcac ttccgctttg 1080 
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cggtgatgca tattcaaagt aatatatgga ataaacaacg tgtttaagca tgaaagaa&g 1140 

gaaacaaagg ccgctttgaa caaatgcata atatttcaga eaaaaatgat ctaaagcaag 1200 

cagtaaatca aacaagaaac attgctgatt cgcgttagaa aacgataaaa gtctaataag 1260 

ccactaagta tacttcaatg aactttttgt atgcttatgg tccaatcaga ccaataattt 1320 

gtgaccafctc ctgaggtggc tttggtgatg cggaaacaga aaaaaatttt ctcaccaatc 1380 

gatttaaaaa acaatttctg ctttgaacca aaactttttt tttctcttta atcattaact 1440 

ttatcaagta tgtacctacc ctcaaagtcc tcactcaagc acaattatgc taetcattstt 1500 

ccaccttctc tttagaaatg 1520 



<210> 36 

<211> 16245 

<212> DNA 

<213> Artificial 

<220> 

<223> Plasmid 



<220> 

<221> misc_feature 

<222> (10264) .- (10264) 

<223> n is a, c, g, or t 

<220> 

<221> misc_feature 

<222> (10472) .. (10472) 

<223> n is a, c, g, or t 

<220> 

<221> misc_feature 

<222> (10563) .. (10563) 

<223> n is a, c, g, or t 
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<;400> 36 

ccgggctggt tgccctcgcc gctgggctgg cggccgtcta tggccctgca aacgcgccag 60 

aaacgccgtc gaagccgtgt gcgagacacc gcggccgccg gcgttgtgga tacctcgcgg 120 

aaaacttggc cctcactgac agatgagggg cggacgttga cacttgaggg gccgactcac 180 

ccggcgcggc gttgacagat gaggggcagg ctcgatttcg gccggcgacg tggagctggc 240 

cagcctcgca aafccggcgaa aacgcctgat tttacgcgag tttcccacag atgatgtgga 300 

caagcctggg gataagtgcc ctgcggtatt gacacttgag gggcgcgact actgacagat 360 

gaggggcgcg atccttgaca cttgaggggc agagtgctga cagatgaggg gcgcacctat 420 

tgacatttga ggggctgtcc acaggcagaa aatccagcat ttgcaagggt ttccgcccgt 480 

tfcfctcggcca ccgctaacct gtcttttaac ctgcttttaa accaatattt ataaaccttg 540 

tttttaacca gggctgcgcc ctgtgcgcgt gaccgcgcac gccgaagggg ggfcgcccccc 600 

cttctcgaac cctcccggcc cgcfcaacgcg ggcctcccat ccccccaggg gctgcgcocc 660 

tcggccgcga acggcctcac cccaaaaatg gcagcgctgg cagtccttgc cattgccggg 720 

atcggggcag fcaacgggatg ggcgatcagc ccgagcgcga cgcccggaag cattgacgtg 780 

ccgcaggtgc tggcatcgac attcagcgac caggtgccgg gcagtgaggg cggcggcctg 840 

ggtggcggcc tgcccttcac ttcggccgtc ggggcattca cggacttcat ggcggggccg 900 

ocaattttta ccttgggcat tcttggoata gtggtcgcgg gtgccgtgct cgtgttcggg 960 

ggtgcgataa acccagcgaa ccatttgagg tgataggtaa gattataccg aggtatgaaa 1020 

acgagaattg gacctttaca gaattactct atgaagcgcc atatttaaaa agctaccaag 1080 

acgaagagga tgaagaggat gaggaggcag attgccttga atafcattgac aatacfcgata 1140 

agataatata tcttttatat agaagatatc gccgtatgta aggatttcag ggggcaaggc 1200 

ataggcagcg cgcttatcaa tatatctata gaatgggcaa agcataaaaa cttgcatgga 1260 
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ctaatgctfcg aaacccagga caataacctt atagcttgta aattctatca taattgggta 1320 

atgactccaa cttattgata gtgtttfcatg ttcagafcaat gcccgatgac fcttgtcatgc 1380 

agctccaccg attttgagaa cgacagcgac ttccgtccca gccgtgccag gtgctgcctc 1440 

agattcaggt tatgccgctc aattcgctgc gtafcatcgct tgctgattac gfcgcagcttt 1500 

cccttcaggc gggafctcata cagcggocag ccatccgtca tccatatcac cacgtcaaag 1560 

ggtgacagca ggctcataag acgcoccagc gtcgccatag tgcgttcacc gaatacgtgc 1620 

gcaacaaccg tcttccggag act'gtcatac gcgtaaaaca gccagcgctg gcgcgattta 1680 

gccccgacat agccccactg ttcgtccatt tccgcgcaga cgatgacgtc actgcccggc 1740 

tgtatgcgcg aggttaccga ctgcggcctg agttttttaa gtgacgtaaa atcgfcgttga 1800 

ggccaacgcc cataatgcgg gctgttgccc ggcatccaac gccattcatg gccatatcaa 1860 

tgattttctg gtgcgtaccg ggttgagaag cggtgtaagt gaactgcagt tgccatgttt 1920 

tacggcagtg agagcagaga tagcgctgat gtccggcggt gcttttgccg ttacgcacca 1980 

ccccgtcagt agctgaacag gagggacagc tgatagacac agaagccact ggagcacctc 2040 

aaaaacacca tcatacacta aatcagtaag ttggcagcat cacccataat tgtggtttca 2100 

aaatcggctc cgtcgatact atgttatacg ccaactttga aaacaacttt gaaaaagctg 2160 

ttt-.fcnfcggta tttaaasttt tacraatgcaa ggaacagtga attggagttc gtcttgttat 2220 

aattagcttc ttggggtatc tttaaatact gtagaaaaga ggaaggaaat aataaatggc 2280 

fcaaaatgaga atatcaccgg aattgaaaaa actgatcgaa aaataccgct gcgtaaaaga 2340 

tacggaagga atgtctcctg ctaaggtata taagctggtg ggagaaaatg aaaacctata 2400 

tttaaaaatg acggacagcc ggtataaagg gaccacctat gatgtggaac gggaaaagga 2460 

catgatgcta tggctggaag gaaagctgcc tgttccaaag gtcctgcact ttgaacggca 2520 
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tgatggctgg agcaatctgc tcatgagtga ggccgatggc gtcctttgct cggaagagta 2580 

tgaagatgaa caaagccctg aaaagattat cgagctgtat gcggagtgca tcaggcfcctt 2640 

tcactccatc gacatatcgg attgtcccta tacgaatagc ttagacagcc gcttagccga 2700 

attggattac ttactgaata acgatctggc cgatgtggat tgcgaaaact gggaagaaga 2760 

cactccattt aaagatccgc gcgagctgta tgatttttta aagacggaaa agcccgaaga 2820 

ggaacttgtc ttttcccacg gcgacctggg agacagcaac atctttgtga aagatggcaa 2880 

agtaagtggc tttattgatc ttgggagaag cggcagggcg gacaagtggt atgacattyc 2940 

cttctgcgtc cggtcgatca gggaggatat cggggaagaa cagtatgtcg agctattttt 3000 

tgacttactg gggatcaagc ctgattggga gaaaataaaa tattatattt tactggatga 3060 

attgtttbag tacctagatg tggcgcaacg atgecggcga caagcaggag cgcaccgact 3120 

tcttccgcat caagtgtttt ggctctcagg cegaggccca cggcaagtat ttgggcaagg 3180 

ggtcgctggt attcgtgcag ggcaagattc ggaataccaa gtacgagaag gacggccaga 3240 

cggtctacgg gaccgacttc attgccgata aggtggatta tctggacacc aaggcaccag 3300 

gcgggtcaaa tcaggaataa gggcacattg ccccggcgtg agtcggggca atcccgcaag 3360 

gagggtgaat gaatcggacg tttgaccgga aggcatacag gcaagaactg atcgacgcgg 3420 

ggttttccgc ogaggatgcc gaaaccatcg caagccgcac cgtcatgcgt gcgccccgag 3480 

aaaccttcca gtccgtcggc tcgatggtcc agcaagctac ggccaagatc gagcgcgaca 3540 

gcgtgcaact ggctccccct gccctgcccg cgccatcggc cgccgtggag cgttcgcgtc 3600 

gtctcgaaca ggaggcggca ggtttggcga agtcgatgac catcgacacg cgaggaacta 3660 

tgacgaccaa gaagcgaaaa accgccggcg aggacctggc aaaacaggtc agcgaggcca 3720 

agcaggccgc gttgctgaaa cacacgaagc agcagatcaa ggaaatgcag ctttccfcfcgt 3780 
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tcgatattgc gccgtggccg gacacgatgc gagcgatgcc aaacgacacg gcccgctctg 3840 

ccctgttcac cacgcgcaac aagaaaatcc cgcgcgaggc gctgcaaaac aaggtcattt 3900 

tccacgtcaa caaggacgfcg aagatcacct acaccggcgt cgagctgcgg gccgacgatg 3960 

acgaactggt gtggcagcag gtgttggagt acgcgaagcg cacccctatc ggcgagccga 4020 

tcaccttcac gttctacgag ctttgccagg acctgggctg gtcgatcaat ggccggtatt 4080 

acacgaaggc cgaggaatgc ctgtcgcgcc tacaggcgac ggcgatgggc ttcacgtccg 4140 

accgcgttgg gcacctggaa tcggtgtcgc tgctgcaccg cttccgcgLc ctggaccgtg 4200 

gcaagaaaac gtcccgttgc caggtcctga tcgacgagga aatcgtcgtg ctgtttgctg 4260 

gcgaccacta cacgaaattc atatgggaga agtaccgcaa gctgtcgccg acggcccgac 4320 

ggatgttcga ctatttcagc tcgcaccggg agccgtaccc gctcaagctg gaaaccttcc 4380 

gcctcatgtg cggatcggat tccacccgcg tgaagaagtg gcgcgagcag gtcggcgaag 4440 

cctgcgaaga gttgcgaggc agcggcctgg tggaacacgc ctgggtcaat gatgacctgg 4500 

tgcattgcaa acgctagggc cttgtggggt cagttccggc tgggggttca gcagccagcg 4560 

ctttactggc atttcaggaa caagcgggca ctgctcgacg cacttgcttc gctcagtatc 462 0 

gctcgggacg cacggcgcgc tctacgaact gccgataaac agaggattaa aattgacaat 4680 

fegfcffattaag gctcagattc gacggcttgg agcggccgac gtgcaggatt tccgcgagat 4740 

ccgattgtcg gccctgaaga aagctccaga gatgttcggg tccgtttacg agcacgagga 4800 

gaaaaagccc atggaggcgt tcgctgaacg gttgcgagat gccgtggcat tcggcgccta 4860 

catcgacggc gagatcattg ggctgtcggt cttcaaacag gaggacggcc ccaaggacgc 4920 

tcacaaggcg catctgtccg gcgttttcgt ggagcccgaa cagcgaggcc gaggggtcgc 4980 

cggtatgctg ctgcgggcgt tgccggcggg tttattgctc gtgatgahcg tccgacagat 5040 
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tccaacggga atctggtgga tgcgcatctt catcctcggc gcacttaata tttcgctatt 5100 
ctggagcttg ttgtttattt cggtctaccg cctgccgggc ggggtcgcgg cgacggtagg 5160 
cgctgtgcag ccgctgatgg tcgtgttcat ctctgccgct ctgctaggta gcccgatacg 522 0. 
attgatggcg gtcctggggg ctatttgcgg aactgcgggc gtggcgctgt tggtgttgac 5280 
accaaacgca gcgctagatc ctgbcggcgt cgcagcgggc ctggcggggg cggfcttccat 5340 
ggcgttcgga accgtgctga cccgcaagtg gcaacctccc gtgcctctgc tcacctttac 5400 
cgcctggcaa ctggcggccg gaggacttct gctcgttcca gtagctttag tgtttgatcc 54G0 
gccaatcccg atgcctacag gaaccaatgt tcfccggccfcg gcgtggctcg gcctgatcgg 5520 
agcgggttta acctacttcc tfctggttccg ggggatctcg cgactcgaac ctacagttgfc 
ttccttactg ggctttctca gccccagatc tggggtcgat cagccgggga tgcatcaggc 
cgacagtcgg aacttcgggt ccccgaoctg taccattcgg tgagoaatgg ataggggagt 
tgatatcgtc aacgttcact tctaaagaaa tagcgccact cagcttcctc agcggcttta 
tccagcgatt tcctattatg tcggcatagt tctcaagatc gacagcctgt cacggttaag 
cgagaaatga ataagaaggc tgataattcg gatctctgcg agggagatga tatttgatca 58 80 
caggcagcaa cgctctgtca tcgttacaat caacatgcta ccctccgcga gatcatccgt 
gtttcaaacc cggcagctta gttgccgttc ttccgaatag catcggtaac atgagcaaag 
tctgocgcct tacaacggct ctcccgctga cgccgtcccg gactgatggg cfcgcctgtat 
cgagtggtga ttttgtgccg agctgccggt cggggagctg ttggctggct ggtggcagga 6120 
tatattgtgg tgtaaacaaa ttgacgctta gacaacttaa taacacattg cggacgtttt 6180 
taatgtactg gggtggtttt tettttcace agtgagacgg gcaacagctg attgcccttc 6240 
accgcctggc cctgagagag ttgcagcaag cggtccacgc tggtttgccc cagcaggcga 



5580 
5640 
5700 
5760 
5820 



5940 
6000 
6060 



6300 
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aaatcctgtfc tgatggtggt tccgaaatcg gcaaaatccc ttataaatca aaagaatagc 6360 

ccgagatagg gttgagtgtt gttccagttt ggaacaagag tccactatta aagaacgtgg 642 0 

actccaacgt caaagggcga aaaaccgtct atcagggcga tggcccacfca cgtgaaccat 6480 

cacccaaatc aagttttttg gggtcgaggt gccgtaaagc actaaatcgg aaccctaaag 6540 

ggagcccccg atttagagct tgacggggaa agccggcgaa cgtggcgaga aaggaaggga 6600 

agaaagcgaa aggagegggc gccattcagg ctgcgcaact gttgggaagg gcgatcggtg 6660 

cgggcctctt cgctattacg ccagctggcg aaagggggat gtgctgcaag gcgattaagt 6720 

tgggtaacgc cagggttttc ccagtcacga cgttgtaaaa cgacggccag tgaattcgag 6780 

ctcggfcaccc ggggatcttt cgacactgaa atacgtcgag cctgctccgc ttggaagcgg 6840 

cgaggagcct cgtcctgtca caactaccaa catggagtac gataagggcc agttccgcca 6900 

gctcattaag agccagttca tgggcgttgg catgatggcc gtcatgcatc fcgbacttcaa 6960 

gtacaccaac gctcttctga tccagtcgat catccgctga aggcgctttc gaatctggtt 7020 

aagatccacg tcttcgggaa gccagcgact ggtgacctcc agcgtccctt taaggctgcc 7080 

aacagctttc tcagccaggg ccagcccaag accgacaagg cctccctcca gaacgccgag 7140 

aagaactgga ggggtggtgt caaggaggag taagctcctt attgaagtcg gaggacggag 7200 

cggtgtcaag aggatattct tcgactctgt attatagata agatgatgag gaattggagg 7260 

tagcatagct tcatttggat ttgctttcca ggctgagact ctagcttgga gcatagaggg 7320 

tcctttggct ttcaatattc tcaagtatct agagtttgaa cttattcccfc gtgaaccttt 7380 

tattcaccaa tgagcattgg aatgaacatg aatctgagga ctgcaatcgc catgaggttfc 7440 

tcgaaataca tccggatgtc gaaggcttgg ggcacctgcg ttggtfcgaafc fctagaacgtg 7500 

gcactattga tcatccgata gctctgcaaa gggcgttgca caatgcaagt caaacgttgc 7560 
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tagcagttcc aggfcggaatg ttatgatgag cattgtatta aatcaggaga tatagcatga 7620 

tctctagtta gctcaccaca aaagtcagac ggcgtaacca aaagtcacac aacacaagct 7680 

gtaaggattt cggcacggct acggaagacg gagaagccac cttcagtgga ctcgagtacc 7740 

atttaattct atttgtgttt gatcgagacc taatacagcc cctacaacga ccafccaaagt 78 00 

cgtatagcta ccagtgagga agtggactca aatcgacttc agcaacatct cctggataaa 7860 

ctttaagcct aaactataca gaataagata ggtggagagc ttataccgag ctcccaaatc 7920 

tgtccagatc atggttgacc ggtgcctgga tcttcctata gaatcatcct tattcytuy^ 7900 

cctagctgat tctggagtga cccagagggt catgacttga gcctaaaatc cgccgcctcc 8040 

accatttgta gaaaaatgtg acgaactcgt gagctctgta cagtgaccgg tgactctttc 8100 

tggcatgogg agagacggac ggacgcagag agaagggctg agtaataagc cactggccag 8160 

acagctctgg cggctctgag gtgcagtgga tgattattaa tccgggaccg gccgccccto 8220 

cgccccgaag tggaaaggct ggtgtgcccc tcgttgacca agaatctatt gcatcatcgg 8280 

agaatatgga gcttcatcga atcaccggca gtaagcgaag gagaatgtga agccaggggt 8340 

gtatagccgt cggcgaaata gcatgocatt aacctaggta cagaagtcca attgcttccg 8400 

atctggtaaa agattcacga gatagtacct tctccgaagt aggtagagcg agtacccggc 8460 
gcgtaagctc cctaattggc ccatccggca tctgtagggc gtccaaatat cgtgcctctc 8520 
ctgctttgcc cggtgtatga aaccggaaag gccgctcagg agctggccag cggcgcagac 8580 
cgggaacaca agctggcagt cgacccatcc ggtgctctgc actcgacctg ctgaggtccc 8640 
tcagtccctg gtaggcagct ttgccccgtc tgtccgcccg gtgtgtcggc ggggttgaca 8700 
aggtcgttgc gtcagtcoaa catttgttgc catattttcc tgcfcctcccc accagctgct 8760 
cttttctttt ctctttcttt tcccatcttc agtatattca tcttcccatc caagaacctt 8820 
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tatttcccct aagtaagtac tttgctacat ccatactcca tccttcccat ccctfcattcc 8880 

tfctgaacctt tcagttcgag ctttcccact tcatcgcagc ttgactaaca gctaccccgc 8940 

ttgagcagac afccaccatgc ctgaactcac cgcgacgtct gtcgagaagt ttctgatcga 9000 

aaagttcgac agcgtctccg acctgatgca gctctcggag ggcgaagaat ctcgtgcttt 9060 

cagcttcgat gtaggagggc gtggatatgt cctgcgggta aatagctgcg ccgatggttt 9120 

ctacaaagat cgttatgttt afccggcactt tgcatcggcc gcgctcccga ttccggaagt 9180 

gcttgacatt ggggaattca gcgagagcct gacctatUyc atctcccgcc gtgcacaggg 9240 

tgtcacgttg caagacctgc ctgaaaccga actgcccgct gttctgcagc cggtcgcgga 9300 

ggccatggat gcgatcgctg cggccgatct tagccagacg agcgggttcg gcccattcgg 9360 

accgcaagga atcggtcaat acactacatg gcgtgatttc atatgcgcga ttgctgatcc 9420 

ccatgtgtat cacbggcaaa ctgtgatgga cgacaccgtc agtgcgtccg tcgcgcaggc 9480 

tctcgatgag ctgatgcttt gggccgagga ctgccccgaa gtccggcacc tcgtgcacgc 9540 

ggatttcggc tccaacaatg tcctgacgga caatggccgc ataacagcgg tcattgactg 9500 

gagcgaggcg atgttcgggg attcccaata cgaggtcgcc aacatcttct tctggaggcc 9GGO 

gtggttggct tgtatggagc agcagacgcg ctacttcgag cggaggcatc cggagcttgc 9720 

aggatcgccg cggctccggg cgtatatgct ccgcattggt cttgaccaac tctatcagag 9780 

cttggttgac ggcaatttcg atgatgcagc ttgggcgcag ggtcgatgcg acgcaatcgt 9840 

ccgatccgga gccgggactg tcgggcgtac acaaatcgcc cgcagaagcg cggccgtctg 9900 

gaccgatggc tgtgtagaag tactcgccga tagtggaaac cgacgcccca gcactcgtcc 9960 

gagggcaaag gaatagagta gatgccgacc gcgggatcga tccacttaac gttactgaaa 10020 

tcatcaaaca gcttgacgaa tctggatata agatcgttgg tgtcgatgtc agctccggag 10080 
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ttgagacaaa tggtgttcag gatctcgata agatacgttc atttgtccaa gcagcaaaga 
gtgccttcta gtgatttaat agctccatgt caacaagaat aaaacgcgtt ttcgggttta 102 00 
cctcttccag atacagctca tctgcaatgc attaatgcat tgactgcaac ctagtaacgc 10260 
cttncaggct ccggcgaaga gaagaatagc ttagcagagc tattttcatt ttcgggagac 10320 
gagatcaagc agatcaacgg tcgtcaagag acctacgaga ctgaggaatc cgctcttggc 10380 
tccacgcgac tatatatttg tctctaattg tactttgaca fcgcteetctt ctttactctg 10440 
atagcttgac tatgaaaatt ccgtc&ucctg aciccfcgggtt cgcaaagata afctgoabgtt 
tcttccttga actctcaagc ctacaggaca cacattcatc gtaggtataa acctcgaaat 
canttcctac taagatggta tacaatagta accatgcatg gttgcctagt gaatgctccg 
taacacccaa tacgccggcc gaaacttttt tacaactctc ctatgagtcg tttacccaga 
atgcacaggt acacttgttt agaggtaatc cttctttcta gctagaagtc ctcgtgtact 
gtgtaagcgc ccactccaca tctccactcg acctgcaggc atgcaagctt aatctataca 
atgctccata gactcacatt gatattgtcg aagatttcga tgctgactta gtagagcaac 10860 
tacaaaagtt agcagagaag catgatttct taatctttga agaccguaag tttgcagata. 
tcggfcatgtg aattctatct attttttttc tgatgtgtgc atggatgact catgatcata 
ttcttaggta atactgtcaa gcatcaatat ggcaagggcg tttacaagat tgcttcttgg 11040 
tctcatatta cfcaatgctca cacagttcct ggagaaggta ttatcaaggg acttgccgaa 11100 
gtcggcctcc ctcttggtcg tggcttgctt ttgctagcag aaatgtcatc tcaaggtgca 11160 
ttaactaagg gtatttacac tgccgaatct gtcaatatgg ctcgccgcaa caaagatttc 11220 
gtttttggct ttattgcaca acacaaaatg aatcagtatg atgatgagga ttttgttgtc 11280 
atgtcgcctg aagcttggcg taatcatggt catagctgtt tcctgtgtga aattgttatc 11340 
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cgctcacaat tccacacaac atacgagccg gaagcataaa gtgtaaagcc tggggtgcct 11400 

aatgagtgag ctaactcaca ttaattgcgt fcgcgctcact gcccgctttc cagtcgggaa 11460 

acctgtcgtg ccagctgcat taatgaatcg gccaacgcgc ggggagaggc ggtfctgcgta 11520 

ttgggccaaa gacaaaaggg cgacattcaa ccgattgagg gagggaaggt aaatattgac 11580 

ggaaattatt cattaaaggt gaattatcac cgtcaccgac ttgagccatt tgggaattag 11640 

agccagcaaa atcaccagta gcaccattac cattagcaag gccggaaacg tcaccaatga 11700 

aaccatcgat agcagcaccg LactLcctgt&g- cgaoogaatc aagttfcgcat btagcgtcag 117 GO 

actgtagcgc gttttcatcg gcattttcgg tcatagcccc cttattagcg ttfcgccatct 11820 

tttcataatc aaaatcaccg gaaccagagc caccaccgga accgcctccc tcagagccgc 11880 

caccctcaga accgccaccc tcagagccac caccctcaga gccgccacca gaaccaccac 11940 

cagagccgcc gccagcattg acaggaggcc cgatctagta acatagatga caccgcgcgc 12000 

gataatttat cctagtttgc gcgctatatt ttgttttcta tcgcgtatta aatgtataat 12060 

tgcgggactc taatcataaa aacccatctc ataaataacg tcatgcatta catgttaatt 12120 

attacatgct taacgtaatt caacagaaat tatatgataa tcatcgcaag accggu&aua. 12180 

ggattcaatc ttaagaaact ttatfcgccaa atgtttgaac gatcggggat catccgggtc 12240 

tgtggcggga acfcccacgaa aatatccgaa cgcagcaaga tatcgcggtg catctcggtc 12300 

ttgcctgggc agtcgccgcc gacgccgttg atgtggacgc cgggcccgat catattgtcg 12360 

ctcaggatcg tggcgttgtg cttgtcggcc gttgctgtcg taatgatatc ggcaccttcg 12420 

accgcctgtt ccgcagagat cccgtgggcg aagaactcca gcatgagatc cccgcgcfcgg 12480 

aggatcatcc agccggcgtc ccggaaaacg attccgaagc ccaacctttc atagaaggcg 12540 

gcggtggaat cgaaatctcg tgatggcagg ttgggcgtcg cttggtcggt catttcgaac 12600 
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cccagagtcc cgctcagaag aactcgtcaa gaaggcgata gaaggcgatg cgctgcgaat 
cgggagcggc gataccgtaa agcacgagga agcggfccagc ccattcgccg ccaagctctt 12720 
cagcaatatc acgggtagcc aacgctatgt cctgatagcg gtccgccaca cccagccggc 12780 
cacagtcgat gaatccagaa aagcggccat tttccaccat gatattcggc aagcaggcat 12840 
cgccatgggt cacgacgaga tcatcgccgt cgggcatgcg cgccttgagc ctggcgaaca 12900 
gttcggctgg cgcgagcccc tgatgctctt cgtccagatc atcctgatcg acaagaccgg 12960 
Gttccatccg agtacgtgcb cgctagatgc gatgtttcgc ttgghggteg aatgggcagcr 13020 
tagccggatc aagcgtatgc agccgccgca ttgcatcagc catgatggat actttctcgg 13080 
caggagcaag gtgagatgac aggagatcct gccccggcac ttcgcccaat agcagccagt 13140 
cccttcccgc ttcagtgaca acgtcgagca cagctgcgca aggaacgccc gtcgtggcca 13200 
gccacgatag ccgcgctgcc tcgtcctgca gttcattcag ggcaccggac aggtcggtot 13260 
tgacaaaaag aaccgggcgc ccctgcgctg acagccggaa cacggcggca tcagagcagc 13320 
cgattgtctg ttgtgcccag tcatagccga atagcctctc cacccaagcg gccggagaac 
Ctgcgtgcaa tccatcttgt Lcaatcatgc gaaacgatco agatccggtg cagattattt 1 
ggattgagag tgaatatgag actctaattg gataccgagg ggaatttatg gaacgtcagt 13500 
ggagcatttt tgacaagaaa tatttgctag ctgatagtga ccttaggcga cttttgaacg 13560 
cgcaataatg gtttctgacg tatgtgctta gctcattaaa ctccagaaac ccgcggctga 13620 
gtggctoctt caacgttgcg gttctgtcag ttccaaacgt aaaacggctt gtcccgcgtc 13680 
atcggcgggg gtcataacgt gactccctta attctccgct catgatcaga ttgtcgtttc 13740 
ccgccttcag tttaaactat cagtgtfctga caggatatat tggcgggtaa acctaagaga 138O0 
aaagagcgtt tattagaata atcggatatfc taaaagggcy Lyciaaaggtfc fcafcccgttcg 13 860 
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tccatttgta tgtgcatgcc aaccacaggg ttccccagat ctggcgccgg ccagcgagac 13920 

gagcaagatt ggccgccgcc cgaaacgatc cgacagcgcg cccagcacag gtgcgcaggc 13980 

aaattgcacc aacgcataca gcgccagcag aatgccatag tgggcggtga cgtcgttcga 14040 

gtgaaccaga tcgcgcagga ggcccggcag caccggcata atcaggccga tgccgacagc 14100 

gtcgagcgcg acagtgctca gaattacgat caggggtatg ttgggtttca cgtctggcct 14160 

' ccggaccagc ctccgctggt ccgattgaac gcgcggattc tttatoactg ataagttggt 14220 

ggacatatta tgtttatcag tgataaagtg tcaagcatga caaagttgca gccgaataca 14280 

gtgatccgtg ccgccctgga cctgttgaac gaggtcggcg tagacggtct gacgacacgc 14340 

anwnfcoaciw aacsgttacra ggttcagcag ccggcgcttt actggcactt caggaacaag 14400 

cgggcgctgc tcgacgcact ggccgaagcc atgetggcgg agaatcatac gcattcggtg 14460 

ccgagagccg acgacgactg gcgctcattt ctgatcggga atgcccgcag cttcaggcag 14520 

gcgctgctcg cctaccgcga tggcgcgcgc atccatgccg gcacgcgacc gggcgcaocg 14580 

cagatggaaa cggccgacgc gcagcttcgc ttcctctgcg aggcgggttt ttcggccggg 14640 

gacgccgtca atgcgctgat gacaatcagc tacttcactg ttggggccgt gcttgaggag 147 00 

caggccggcg acagcgatgc cggcgagcgc ggcggcaccg ttgaacaggc tccgctctcg 14760 

oogctgfctgc gggeogcgah agacgccttc cracgaagccg gtccggacgc agcgttcgag 14820 

cagggactcg cggtgattgt cgatggattg gegaaaagga ggctcgttgt caggaacgtt 14880 

gaaggaccga gaaagggtga cgattgatca ggaccgctgc cggagcgcaa cccactcact 14940 

acagcagagc catgtagaca acatcccctc cccctttcca ccgcgtcaga cgcccgtagc 15000 
agcccgctac gggctttttc atgccctgcc ctagcgtcca agccfccacgg ccgcgctcgg 15060 
cctctctggc ggccttctgg cgctcttccg cttcctcgct cactgactcg ctgcgctcgg 15120 
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tcgttcggct gcggcgagcg gtatcagctc actcaaaggc ggtaatacgg ttatccacag 15180 
aatcagggga taacgcagga aagaacatgt gagcaaaagg ccagcaaaag gcoaggaacc 15240 
gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg cccccctgac gagcatcaca 15300 
aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg actataaaga taccaggcgfc 15360 
ttccccctgg aagctccctc gtgcgctctc ctgttccgac cctgccgctt accggatacc 15420 
tgtccgcctt tctcccttcg ggaagogtgg cgcttttccg ctgcataacc ctgcttcggg 15480 
gtcattatag cgattttttc ggtatatcca tcctttttcg cacgatatac aggattttgc 15540 
caaagggttc gtgtagactt tccttggtgt atccaacggc gtcagccggg caggataggt 15600 
ffaagtascfcc cacccgcgag cgggtgttcc tfccttcactg tcccttattc gcacctggcg 15660 
gtgctcaacg ggaatcctgc tctgcgaggo tggccggcta ccgccggcgt aacagatgag 15720 
ggcaagcgga tggctgatga aaccaagcca accaggaagg gcagcccacc tatcaaggtg 
tactgccttc cagacgaacg aagagcgatt gaggaaaagg cggcggcggc cggcatgagc 
ctgtcggcct acctgctggc cgtcggccag ggcfcacaaaa tcacgggcgt cgtggactat 
gagcacgtcc gcgagctggc ccgcatcaat ggcgacctgg gccgcctggg cggcctgctg 
aaacfcctggc tcaccgacga cccgcgcacg gcgcggttcg gtgatgccac gatcctcgcc 
ctgctggcga agatcgaaga gaagcaggac gagcttggca aggtcatgat gggcgtggtc 16080 
cgcccgaggg cagagccatg acttttttag ccgcfcaaaac ggccgggggg tgcgcgtgat 16140 
tgccaagcac gtccccatgc gctccatcaa gaagagcgac ttcgcggagc tggtgaagta 16200 
catcaccgac gagcaaggca agaccgagcg cctttgcgac gctca 16245 
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<220> 

<221> misc„feature 

<222> (10264) .. (10264) 

<223> n is a, c, g, or t 

<220> 

<221> misc_feature 

<222> (10472) (10472) 

<223:> n is a, c, g, or t 

<220> 

<221> misc_feature 

<222> (10563) .. (10563) 

<223> n is a, c, g, or t 

<400* 37 

ccgggctggt tgccctcgcc gctgggctgg cggccgtcta tggccctgca aacgcgccag 60 

aaacgccgtc gaagccgtgt gcgagacacc gcggccgccg gcgttgtgga tacctcgcgg 120 

aaaacttggc cctcactgac agatgagggg cggacgttga cacttgaggg gccgactcac 180 

ccggcgcggc gttgacagat gaggggcagg ctcgatttcg gccggcgacg- tggagctggc 240 

cagcctcgca aatcggcgaa aacgcctgat tttacgcgag tttcccacag atgatgtgga 300 

caagcctggg gataagtgcc ctgcggtatt gacacttgag gggcgcgact actgacagat 360 

gaggggcgcg atccttgaca cttgaggggc agagtgctga cagatgaggg gcgcacctat 420 

tgacatttga ggggctgtcc acaggcagaa aatccagcat ttgcaagggt ttccgcccgt 480 



ttttcggcca ccgctaacct gtcttttaac ctgcttttaa accaafcattt ataaaccttg 
tttttaacca gggctgcgcc ctgtgcgcgfc gaccgcgcac gccgaagggg ggtgcccccc 
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cttctcgaac cctcccggcc cgctaacgcg ggcctcccat ccccccaggg gctgcgcccc 660 

tcggccgcga acggcctcac cccaaaaatg gcagcgctgg cagfcccttgc cattgccggg 720 

atcggggcag taacgggatg ggcgatcagc ccgagcgcga cgcccggaag cattgacgtg 780 

ccgcaggtgo tggcatogac attcagnga« tmcrgtgccctg acagtgaggg cggcggcctg 840 

ggtggcggcc tgcccttcac ttcggccgtc ggggcattca cggacttcat ggcggggccg 900 

gcaattttta ccttgggcat tcttggcata gtggtcgcgg gtgccgtgct cgtgttcggg 960 

ggtgcgataa acccagogaa ccatfctgagg tgataggtaa gattataccg aggtafcgaaa 1020 

acgagaattg gacctttaca gaattactct atgaagcgcc atatttaaaa agctaccaag 1080 

acgaagagga tgaagaggat gaggaggcag attgccttga atatattgac aatactgata 1140 

agataatata tcttttatat agaagatatc gccgtatgta aggatttcag ggggcaaggc 1200 

ataggcagcy cgcttatcaa fcafcafectata gaatgggaaa agcataaaaa r.t-.tgcatffoa 1260 

ctaatgcttg aaacccagga caataacctt atagcttgta aattctatca taattgggta 1320 

atgactccaa cttattgata gtgttttatg ttcagataat gcccgatgac tttgtcatgc 1380 

agctccaccg attttgagaa cgacagcgac ttccgtccca gccgtgccag gtgctgcctc 1440 

agattcaggt tatgccgctc aattcgctgc gtatatcgct tgctgattac gtgcagcttt 1500 

ccctfccaggc gggattcata cagcggccag ccatccgtca tccatatcac cacgtcaaag 15S0 

ggtgacagca ggctcataag acgccccagc gtcgccatag tgcgttcacc gaatacgtgc 1620 

gcaacaaccg tcttccggag actgtcatec gcgtaa&sce. gcc&gcgctg gagagattta 1680 

gccccgacat agccccactg ttcgtccatt tccgcgcaga cgatgacgtc actgcccggc 1740 

tgtatgcgcg aggttaccga ctgcggcctg agttttttaa gtgacgtaaa atcgtgttga 1800 
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ggccaacgcc cafcaatgcgg gctgttgccc ggcatccaac gccattcatg gccatatcaa 1860 

tgattttctg gtgcgtaccg ggttgagaag cggtgtaagt gaactgcagt tgccatgttt 1920 

tacggcagtg agagcagaga tagcgctgat gtccggcggt gcttttgccg ttacgcacca 1980 

ccccgtcagt agctgaacag gagggacagc tgatagacac agaagccact ggagcacctc 2040 

aaaaacacca tcatacacta aatcagtaag ttggcagcat cacccataat hgtggtttca 2100 

aaatcggctc cgtcgatact atgttatacg ccaactttga aaacaacttt gaaaaagctg 2160 

ttttctggta tttaaggttt tagaatgcaa ggaacagtga attggagttc gtcttgttat 2220 

aattagcttc ttggggtatc tttaaatact gtagaaaaga ggaaggaaat aataaatggc 2280 

taaaatgaga atatcaccgg aattgaaaaa actgatcgaa aaataccgct gcgtaaaaga 2340 

tacggaagga atgtctcctg ctaaggtata taagctggtg ggagaaaatg aaaaccfcata 2400 

tttaaaaatg acggacagcc ggtataaagg gaccacctat gatgtggaac gggaaaagga 2460 

catgatgcta tggctggaag gaaagctgcc tgttccaaag gtcctgcact ttgaacggca 2520 

tgatggctgg agcaatctgc tcatgagtga ggccgatggc gtcctttgct cggaagagta 2580 

tgaagatgaa caaagccctg aaaagattat cgagctgtat gcggagtgca tcaggctctt 2640 

tcactccatc gacatatcgg attgtcccta tacgaatagc ttagacagcc gcttagccga 2700 

attggattac ttactgaata acgatctggc cgatgtggat tgcgaaaact gggaagaaga 2760 

cactccattt aaagatccgc gcgagctgta tgatttttta aagacggaaa agcccgaaga 2820 

ggaacttgtc ttttcccacg gcgacctggg agacagcaac atctttgtga aagatggcaa 2880 

agtaagtggc fctfcatfcgafcc tfcgggagaag cggcagggog gacaagtggt atgafratfcgc 2940 

cttctgcgtc cggtcgatca gggaggatat cggggaagaa cagtatgtcg agctattttt 3000 

tgacttactg gggatcaagc ctgattggga gaaaataaaa tattatattt tactggatga 3060 
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attgttttag tacctagatg tggcgcaacg atgccggcga caagcaggag cgcaccgact 3120 

bcttccgcat caagtgtttt ggctctcagg ccgaggccca cggcaagtat ttgggcaagg 3180 

ggtcgctggt attcgtgcag ggcaagattc ggaahaccaa gtacgagaag gacggccaga 3240 

cggtctacgg gaccgacttc attgccgata aggtggatta tctggacacc aaggcaccag 3300 

gcgggtcaaa tcaggaataa ggueaoatta cccccrscgtg agtcggggca atcccgcaag 3360 

gagggtgaat gaatcggacg tttgaccgga aggcatacag gcaagaactg atcgacgcgg 3420 

ggttttccgc cgaggatgcc gaaaccatcg aaagccgcac cgtcatgcgt gcgccccgcg 3480 

aaaccttcca gtccgtcggc tcgatggtcc agcaagctac ggccaagatc gagcgcgaca 3540 

gcgtgcaact ggctccccct gccctgcccg cgccatcggc cgccgtggag cgttcgcgtc 3600 
gtctcgaaca ggaggcggca ggtttggcga agtcgatgac catcgacacg cgaggaacta 3660 
tgacgaccaa gaagogaaaa accgccggcg aggacctggc aaaacaggtc agcgaggcca 3720 
agcaggccgc yttgctgaaa cacacgaaga agcagat^a gcraaatgcag ctttccttgt 3780 
tcgatattgc gccgtggccg gacacgatgc gagcgatgcc aaacgacacg gcccgctctg 3840 
ccctgttcac cacgcgcaac aagaaaatcc cgcgcgaggc gctgcaaaac aaggtcattt 3900 
hccacgtcaa caaggacgtg aagatcacct acaccggcgt cgagctgcgg gccgacgatg 3960 
acgaactggt gtggcagcag gtgttggagt acgcgaagcg cacccctatc ggcgagccga 4020 
tcaccttcac gttctacgag ctttgccagg acctgggctg gtcgatcaat ggccggtatt 4080 
acacgaaggc cgaggaatgn ctgtcgcgcc tacaggcgac ggcgatgggc ttcacgtccg 4140 
accgcgttgg gcacctggaa teggtgtegc . tgctgoaccg cttocgogtc ctggaacgtg 4200 
gcaagaaaac gtcccgttgc caggtcchga tcgacgagga aatcgtcgtg ctgtttgctg 4260 
gcgaccacta cacgaaattc atatgggaga agtaccgcaa gctgtcgccg acggcccgac 4320 
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ggatgttcga ctatttcagc tcgcaccggg agccgtaccc gctcaagctg gaaaccttcc 4380 

gcctcatgtg cggatcggat tccacccgcg tgaagaaghg gcgcgagcag gtcggcgaag 4440 

cctgcgaaga gttgcgaggc agcggcctgg tggaacacgc ctgggtcaafc gatgacctgg 4500 

tgcattgcaa acgctagggc cbtgtggggt cagttccggc tgggggttca gcagccagcg 4560 

ctttaotggc atttcaggaa caagcgggca ctgctcgacg cacttgcttc gctcagtatc 4620 

gctcgggacg cacggcgcgc tctacgaact gccgataaac agaggattaa aattgacaat 4680 

tgtgafctaag gctcagattc gacggcttgg agcggccgac gtgcaggatt tccgcgagat 4740 

ccgattgtcg gccctgaaga aagctccaga gatgttcggg tccgtttacg agcacgagga 4800 

gaaaaagccc atggaggcgt tcgctgaacg gttgcgagat gccgtggcat tcggcgccta 4860 

catcgacggc gagatcattg ggctgtcggt cttcaaacag gaggacggcc ccaaggacgc 4920 

tcacaaggcg catctgtccg gcgttttcgt ggagcccgaa cagcgaggcc gaggggtcgc 4980 

cggtatgctg ctgcgggcgt tgccggcggg tttattgcto gtgatgatog tccgacagat 5040 

tccaacggga atctggtgga tgcgcatctt catcctcggc gcacttaata tttcgctatt 5100 

ctggagcttg ttgtttattt cggtctaccg cctgccgggc ggggtcgcgg cgacggtagg 5160 
cgctgtgcag ccgctgatgg tcgtgttcat ctctgccgct ctgctaggta gcccgatacg 5220 
attgatggcg gtcctggggg ctatttgcgg aactgcgggc gtggcgctgt tggtgttgac 5280 
accaaacgca gcgcfcagatc ctgtcggcgt cgcagcgggc ctggcggggg cggtttccat 5340 
ggcgttcgga accgtgctga cccgcaagtg gcaacctccc gtgcctctgc tcacctttac 5400 
cgcctggcaa ctggcggccg gaggacttct gctcgttcca gtagctttag tgtttgatcc 5460 
gccaatcccg atgcctacag gaaccaatgt tctcggcctg gcgtggctcg gcctgatcgg 5520 
agcgggttta acctacttcc tttggttccg ggggatctcg cgactcgaac ctacagttgt 5580 
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ttccttactg ggctttctca gccccagatc tggggtcgat cagccgggga tgcatcaggc 5640 

cgacagtcgg aacttcgggt ccccgacctg taccattcgg tgagcaatgg ataggggagt 5700 

tgatatcgtc aacgttcact tctaaagaaa tagcgccact cagcttcctc agcggcttta 5760 

tccagcgatt tcctattatg tcggcatagt tctcaagatc gacagcctgt cacggttaag 5820 

cgagaaatga ataagaaggc tgataattcg gatctctgcg agggagatga tatttgatca 5880 

caggcagcaa cgctctgtca tcgttacaat caacatgcta ccctccgcga gatcatccgt 5940 

gtttcaaacc cggcagctta gttgccgttc ttccgaatag catcggtaac atgagcaaag 6000 

tctgccgcct tacaacggct ctcccgctga cgccgtcccg gactgatggg ctgcctgtat 6060 

cgagtggtga ttttgtgccg agctgccggt cggggagctg ttggctggct ggtggcagga 6120 

tatattgtgg tgtaaacaaa ttgacgctta gacaacttaa taacacattg cggacgtttt 6180 

taatgtactg gggtggtttt tattttcacc agtgagacgg gcaacagctg attgcccttc 6240 

accgcctggc cctgagagag ttgcagcaag cggtccacgc tggtttgccc cagcaggcga 6300 

aaatcctgtt tgatggtggt tccgaaatcg gcaaaatccc ttataaatca aaagaatagc 6360 

ccgagatagg gttgagtgtt gttccagttt ggaacaagag tccactatta aagaacgtgg 6420 

actccaacgt caaagggcga aaaaccgtct atcagggcga tggcccacta cgtgaaccat 6480 

cacccaaatc aagttttttg gggtcgaggt gccgtaaagc actaaatcgg aaccctaaag 6540 

ggagcccccg atttagagct tgacggggaa agccggcgaa cgtggcgaga aaggaaggga 6600 

agaaagcgaa aggagcgggc gccattcagg ctgcgcaact gttgggaagg gcgatcggtg 6660 

cgggcctctt cgctattacg ccagctggcg aaagggggat gtgctgcaag gcgattaagt 6720 

tgggtaacgc cagggttttc ccagtcacga cgttgtaaaa cgacggccag tgaattcgag 6780 

ctcggfcaccc ggggatcttt cgacactgaa atacgtcgag cctgctccga ttggaagcgg 6840 
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cgaggagcct cgfccctgtca caactaccaa catggagtac gataagggcc agttccgcca 6900 

gctcattaag agccagttca tgggcgttgg catgatggcc gtcatgcatc tgtacttcaa 6960 

gtacaccaac gctcttctga tccagtcgat catccgctga aggcgctttc gaatctggtt 7020 

aagatccacg tcttcgggaa gccagcgact ggtgacctcc agcgtccctt taaggctgcc 7080 

aacagctttc tcagccaggg ccagcccaag accgacaagg cctccctcca gaacgccgag 7140 

aagaactgga ggggtggtgt caaggaggag taagctcctt attgaagtcg gaggacggag 7200 

cggtgtcaag aggatattct tcgacjLeLgL attatagata agatgafcgag ga.attgga.gg 7260 

tagcatagct tcatttggat ttgctttcca ggctgagact ctagcttgga gcatagaggg 7320 

tcctttggct ttcaatattc tcaagtatct cgagtttgaa cttattccct gtgaaccttt 7380 

tattcaccaa tgagcattgg aatgaacatg aatctgagga ctgcaatcgc catgaggttt 7440 

tcgaaataca tccggatgtc gaaggcttgg ggcacctgcg ttggttgaat ttagaacgtg 7500 

gcactattga tcatccgata gctctgcaaa gggcgttgca caatgcaagt caaacgttgc 7560 
fcagcagttcc aggtggaatg ttatgatgag cattgtatta aatcaggaga tatagcatga 7620 
tctctagtta gctcaccaca aaagtcagac ggcgtaacca aaagu^acac aacacaagct 7680 
gtaaggattt cggcacggct acggaagacg gagaagccac cttcagtgga ctcgagtacc 7740 
atttaattct atttgtgttt gatcgagacc taatacagcc cctacaacga ccatcaaagt 7800 
ogtatagcta ccagtgagga agtggactca aatcgacttc agcaacatct cctggataaa 7860 
ctttaagcct aaactataca gaataagata ggtggagagc ttataccgag ctcccaaatc 7920 
tgtccagatc atggttgacc ggtgcctgga tcttcctata gaatcatcct tattcgttga 7980 
cctagcfcgat tctggagtga cccagagggt catgacttga gcctaaaatc cgccgcctcc 8040 
accatttgta gaaaaatgtg acgaactcgt gagctctgta cagtgaccgg cgactctttc 8100 
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tggcatgcgg agagacggac ggacgcagag agaagggctg agtaataagc cactggccag 8160 

acagctctgg cggctctgag gtgcagtgga tgattattaa tccgggaccg gccgcccctc 8220 

cgccccgaag tggaaaggct ggtgtgcccc tcgttgacca agaatctatt gcatcatcgg 8280 

agaatatgga gcttcatcga atcaccggca gtaagcgaag gagaatgtga agccaggggt 8340 

gtatagccgt cggcgaaata gcatgccatt aacctaggta cagaagtcca attgcttccg 8400 

atctggtaaa agattcacga gatagtacct tctccgaagt aggtagagcg agtacccggc 84S0 

gcgtaagctc cctaattggc ccatccggca tctgtagggo gtccaaatat cgtgcctctc 8520 

ctgctttgcc cggtgtatga aaccggaaag gccgctcagg agctggccag cggcgcagac 8580 

cgggaacaca agctggcagt cgacccatcc ggtgctctgc actcgacctg ctgaggtccc 8640 

tcagtccctg gtaggcagct ttgccccgtc tgtccgcccg gtgtgtcggc ggggttgaca 8700 

aggfccgttgc gtrosgtecaa catttgttgc catattttcc tgctctcccc accagcfcgct 8760 

cttttctttt ctctttcttt tcccatcttc agtatattca tcttcccatc caagaacctt 8820 

tatttcccct aagtaagtac tttgctacat ccatactcca tccttcccat cccttattcc 8880 

tttgaaccfct tcagttcgag ctttcccact tcatcgcagc ttgactaaca gctaccccgc 8940 

ttgagcagac atcaccatgc ctgaactcac cgcgacgtct gtcgagaagt ttctgatcga 9000 

aaagttcgac agcgtctccg acctgatgca gctctcggag ggcgaagaat ctcgtgcttt 9060 

cagcttcgat gtaggagggc gtggatatgt cctgcgggta aatagctgcg ccgatggttt 9120 

ctacanagat cgttafcgttt afccggcactt tcrcafcc-ggee gcgctcccga ttccggaagt 9180 

gcttgacatt ggggaattca gcgagagcct gacctafctgc atctcccgcc gtgcacaggg 9240 

tgtcaogttg caagacctgc ctgaaaccga actgcccgct gttctgcagc cggtcgcgga 9300 
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ggccatggat gcgatcgctg cggccgatct tagccagacg agcgggttcg gcccattcgg 9360 

accgcaagga atcggfccaat acactacatg gcgtgatttc atatgcgcga ttgctgatcc 9420 

ccafcgtgtat cactggcaaa ctgtgatgga cgacaccgtc agtgcgtccg tcyugcaggq 9430 

tctcgatgag ctgatgcfctt gggccgagga ctgccccgaa gtccggcacc tcgtgcacgc 9540 

ggatttcggc tccaacaatg tcctgacgga caatggccgc ataacagcgg tcatfcgactg 9600 

gagcgaggcg atgttcgggg attcccaata cgaggtcgcc aacatcttct tctggaggcc 9660 

gtggttggct tgtatggagc agcagacgcg ctacttcgag cggaggcafcc cggagcttgc 972 0 

aggatcgccg cggctccggg cgtatatgct ccgcattggt ctfcgaccaac tctatcagag 9780 

cttggttgac ggcaatttcg atgatgcagc ttgggcgcag ggtcgatgcg acgcaatcgt 9840 

ccgatccgga gccgggactg tcgggcgtac acaaatcgcc cgcagaagcg cggccgtctg 9900 

gaecgatggc tgtgtagaag tactcgccga tagtggaaac cgacgcccca gcactcgtcc 9960 

gaqq-gcaaag gaatagagta gatgccgacc gcgggatcga tccacttaac gttactgaaa 10020 

tcatcaaaca gcfctgacgaa tctggatata agatcgttgg tgtcgatgtc agctccggag 10080 

ttgagacaaa tggtgttcag gatctcgata agatacgttc atttgtccaa gcagcaaaga 10140 

gtgccttcta gtgatttaat agctccatgt caacaagaat aaaacgcgtt ttcgggttta 10200 

cctcttccag atacagctca tctgcaatgc attaatgcat tgactgcaac ctagtaacgc 10260 

cttncaggct ccggcgaaga gaagaatagc ttagcagagc tattttcatt ttcgggagac 10320 

gagatcaagc agatcaacgg tcgtcaagag acctacgaga ctgaggaatc cgctcttggc 10380 

fcenaffgegac tatatatttg tctctaattg tactttgaca tgctcctctt ctttactctg 10440 

atagcttgac fcatgaaaatt ccgtcaccag cxicctgggtt cgcaaagata attgcatgtt 10500 

tcttccttga actctcaagc ctacaggaca cacattcatc gtaggtataa acctcgaaat 10560 
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cantfccctac taagatggta fcacaatagta accatgcatg gttgcctagt gaatgctccg 10620 
taacacccaa tacgccggcc gaaacttttt tacaactctc ctatgagtcg tttacccaga 10680 
atgcacaggt acacttgttt agaggtaatc cttcttteta gctagaagtc ctcgtgtact 10740 
gtgtaagcgc ccactccaca tctccacfccg acctgcaggc atgcaagctt ttttcgagtt 10800 
tttttttttt ttctttgtga aggatttatt gttattggta tecatttttt attggaagac 10860 
aagataagtt aatattgatt ttgcttaaag attaaaagga aatcagaaaa cgacaataaa 10920 
aaatgtaacg gacaaactat ggtgtcgatt ataagtctaa atccttaaaa aatgacaacg 10980 
agttgctttc ctctgaaaac aatfccttttg tctttgcaag aaaggtttct tttttgtttg 11040 
cttgcattac ttaaacatca aatcaaatga aaggaataaa gcagatttga gggcgaataa 11100 
ggattttctg gtcaacaaga tgtgagtgac acctaaggaa ctaaatgcca ttcatttgtt 11160 
ttaaaacgac atcaaagatt gatgatcaac aggattgaga gagagaaaaa gaactcgtgt 11220 
eafcttattte hghfcgactga aattttatat ttagaaaaaa tgtcaaatct atagctttag 11280 
ctatattaca taacatttga aataataata ataaaaaaag acacattaga gacacttttc 11340 
aaactctaaa taactgtcta taaacacaaa gaaaacaaag acctctataa caacttatta 11400 
gatttttctc gtacttttgt ctaaagabga tgtattcttg ttatcccaca cttctttcat 11460 
ttgttcttga tgctactaaa tatacaaaat ttcttttttg caagagatat tattccaaaa 11520 
attttcaaaa agaaattttt ttcacaatag cagttgatcg tgtaacccaa agaggttctt 11580 
tgttattttg cacttccgct ttgcggtgat gcatattcaa agtaatatat ggaataaaca 11640 
acgtgfctfcaa gcatgaaaga aaggaaacaa sggeegcttt gaacaaatcrc- ataatatttc 11700 
agacaaaaat gatctaaagc aagcagtaaa tcaaacaaga aacattgctg attcgcgtta 117 60 
gaaaacgata aaagtctaat aagccactaa gtatacttca atgaactttt tgtatgctta 11820 
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fcggtccaatc agaccaataa tttgtgacca ttcctgaggt ggctfctggtg atgcggaaac 11880 

agaaaaaaat tttctcacca atcgatttaa aaaacaattt ctgctttgaa ccaaaacttt 11940 

ttttttctct ttaatcatta actttatcaa gtatgtacct accctcaaag tcctcactca 12000 

agcacaatta tgctaacatt gttccacctt ctctttagaa atgctgtcga agctgcagtc 12060 

aatcaacgtc aaggcccgcc gcgttgaact agcccgcgac atcacgcggc ccaaagtctg 12120 

cctgcatgct cagcggtgct cgttagttcg gctgcgagtg gcagcaccac agacagagga 12180 

ggcgctggga accgtgcagg ctgccggcgc gggcgatgag cacagcgccg atgtagcact 12240 

ccagcagctt gaccgggcta tcgcagagcg tcgtgcccgg cgcaaacggg agcagctgtc 12300 

ataccaggct gccgccattg cagcatcaat tggcgtgtca ggcattgcca tcttcgccac 12360 

ctacctgaga tttgccatgc acatgaccgt gggcggcgca gtgccatggg gtgaagtggc 12420 

tggcactctc ctcttggtgg ttggtggcgo gctcggcatg gagatgtatg cccgctatgc 12480 

acacaaagcc atctggcafcg agtcgcctct gggctggctg ctgcacaaga gccaccacac 12540 

acctcgcact ggaccctttg aagccaacga cttgtfctgca atcatcaatg gaetgcccgc 12600 

catgctcctg tgtacctttg gcttctggct gcccaacgtc ctgggggcgg ccLgctttgg 12GG0 

agcggggctg ggcatcacgc tatacggcat ggcatatatg tttgtacacg atggcctggt 12720 

gcacaggcgc tttcccaccg ggcccatcgc tggcctgccc tacatgaagc gcctgacagt 12780 

ggcccaccag ctacaccaca gcggcaagta cggtggcgcg ccctggggta tgttcttggg 12840 

tccacaggag ctgcagcaca ttccaggtgc ggcggaggag gtggagcgac tggtcctgga 12900 

actggactgg tccaagcggt agaagcttgg cgtaatcatg gtcatagctg tttcctgtgt 12960 
gaaattgtta tccgctcaca attccacaca acatacgagc cggaagcata aagtgtaaag 13020 
cctggggtgc ctaatgagtg agctaactca cattaattgc gttgcgctca ctgcccgctt 13080 
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tccagtcggg aaacctgtcg tgccagctgc attaatgaafc cggccaacgc gcggggagag 13140 

gcggtttgcg tattgggcca aagacaaaag ggcgacattc aaccgafctga gggagggaag 13200 

gtaaatattg acggaaatta ttcattaaag gtgaattatc accgtcaccg acttgagcca 13260 

tttgggaatt agagccagca aaatcaccag tagcaccatt accattagca aggccggaaa 13320 

cgtcaccaat gaaaccatcg atagcagcac cgtaatcagt agcgacagaa tcaagtttgc 13380 

ctttagcgtc agactgtagc gcgtfcttcat cggcattttc ggtcatagcc cccttattag 13440 

cgcttgccat cttttcataa tcaa.ctcttcac cggaaccaga gcco.cce.ccg gaaccgcctc 13500 

cctcagagcc gccaccctca gaaccgccac cctcagagcc accaccctca gagccgccac 13560 

cagaaccacc accagagccg ccgccagcat tgacaggagg cccgatctag taacatagat 13620 

gacaccgcgc gcgataattfc atcctagttt gcgcgctata ttttgttttc tatcgcgtat 13680 

taaatgtata attgcgggac tctaafccata aaaacccatc tcataaataa cgtcatgcat 13740 

tacatgttaa ttattacatg cttaacgtaa ttcaacagaa attatatgat aatcatcgca 13800 

agaccggcaa caggattcaa tcttaagaaa ctttattgcc aaatgtttga acgatcgggg 13 860 

atcatccggg tctgtggcgg gaactccacg aaaatatccg aacgcagcaa gatatcgcgg 13920 

tgcatctcgg tcttgcctgg gcagtcgccg ccgacgccgt tgatgtggac gccgggcccg 13980 

atcatattgt cgctcaggat cgtggcgttg tgcttgtcgg ccgttgctgt cgtaatgata 14040 

tcggcacctt cgaccgcctg ttccgcagag atcccgtggg cgaagaactc cagcatgaga 14100 

tccccgcgct ggaggatcat ccagccggcg tcccggaaaa cgattccgaa gcccaacctt 14160 

tcatagaagg cggcggtgga atcgaaatct cgtgatggca ggttgggcgt cgcttggtcg 14220 

gtcatttcga aacccagagt cccgctcaga agaactcgtc aagaaggcga tagaaggcga 14280 

tgcgctgcga atcgggagcg gcgataccgt aaagcacgag gaagcggtca gcccattcgc 14340 
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cgccaagctc tteagcaata tcacgggtag ccaacgctat gtcctgatag cggtccgcca 14400 
cacccagccg gccacagtcg atgaatccag aaaagcggcc attttccacc atgatattcg 14460 
gcaagcaggc atcgccatgg gfccacgacga gatcatcgcc gtcgggcatg cgcgccttga 14520 
gcctggcgaa cagttcggct ggcgcgagcc cctgatgctc tfccgtccaga tcatcctgat 14580 
cgacaagaec ggcttccatc cgagtacgtg ctcgctcgat gcgatgtfctc gcttggtggt • 14640 
cgaabgggca ggtagccgga tcaagcgtat gcagccgccg cattgcatca gccatgatgg 14700 
atactttctc ggcaggagM aggt-gagairg acaggagatc Dtgacccggo acttcgccca 147G0 
atagcagcca gtcccttccc gcttcagtga caacgtcgag cacagctgcg caaggaacgc 14820 
ccgtcgfcggc cagccacgafc agccgcgctg cctcgtcctg cagttcattc agggcaccgg 14880 
acaggtcggt cttgacaaaa agaaccgggc gcccctgegc fcgacagccgg aacacggcgg 14940 
catcagagca gccgattgtc tgttgtgccc agtcatagcc gaatagcctc tccacccaag 15 000 
cggccggaga acctgcgtgc aatccatctt gttcaatcat gcgaaacgat ccagatccgg 15060 
tgcagattat ttggattgag agtgaatatg agactctaat tggataccga ggggaattta 15120 
tggaacgtoa gfcggagcafcfc tttgacaaga aafcatfctgct agctgett&gt gaccttaggc 15180 
gacttttgaa cgcgcaataa tggtttctga cgtafcgtgct tagctcatta aactccagaa 15240 
acccgcggct gagtggctcc ttcaacgt'tg cggttctgtc agttccaaac gtaaaacggc 15300 
ttgtcccgcg tcatcggcgg gggtcataac gtgactccct taattctccg ctcatgatca 153 60 
gattgtcgtt tcccgccttc agtttaaact atcagtgttt gacaggatat attggcgggt 15420 
aaacctaaga gaaaagagcg tttattagaa taatcggata tttaaaaggg cgtgaaaagg 15480 
tttatccgtt cgtccatttg tatgtgcatg ccaaccacag ggttccccag atctggcgcc 15540 
ggccagcgag acgagcaagn fctggeygceg cccgaaacga tccgacagcg cgcccagcac 15600 
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aggtgcgcag gcaaattgca ccaacgcata cagcgccagc agaatgccat agtgggcggt 15660 

gacgtcgttc gagtgaacca gafccgcgoag gaggcccggc agcaccggca taatcaggcc 15720 

gatgccgaca gcgtcgagcg cgacagtgct cagaattacg atcaggggta tgttgggttt 157 80 

cacgtctggc ctccggacca gcctccgctg gtccgattga acgcgcggat tctttateac 15840 

tgataagttg gtggacatat tatgtttatc agtgataaag tgtcaagcat gacaaagttg 15900 

cagccgaata cagtgatccg tgccgccctg gacctgttga acgaggtcgg cgtagacggt 15960 

Ctgacgacac gcaadctggc ggaacggfcfcg ggggfcfccagc agccggngct ttactgcrcac 16020 

ttcaggaaca agcgggcgct gctcgacgca ctggccgaag ccatgctggc ggagaatcat 16080 

acgcattcgg fcgccgagagc cgacgacgac tggcgctcat ttctgatcgg gaatgcccgc 16140 
agcttcaggc aggcgctgct cgcctaccgc gatggcgcgc gcatccatgc cggcacgcga 16200 
ccgggagcan cgcagatgga aacggccgac gcgcagcfctc gcttcctctg cgaggcgggt 16260 
ttttcggccg gggacgccgt caatgcgctg atgacaatca gctacttcac tgttggggcc 16320 
gtgcttgagg agcaggccgg cgacagcgat gccggcgagc gcggcggcac cgttgaacag 16380 
gctccgctct cgccgctgtt gcgggccgcg atagacgcct tcgacgaagc cggtccggac 16440 
gcagcgttcg agcagggact cgcggtgatt gtcgatggat tggcgaaaag gaggctcgtt 16500 
gtcaggaacg ttgaaggacc gagaaagggt gacgattgat caggaccgct gccggagcgc 1656U 
aacccactca ctacagcaga gccatgtaga caacatcccc tccccctttc caccgcgtca 16620 
gacgcccgta gcagaccget acgggctttt tcatgccctg ccctagcgtc caagcctcac 16680 
ggccgcgctc ggcctctctg gcggccttct ggcgctcttc cgcttcctcg ctcactgact 16740 
cgctgcgctc ggtcgttcgg ctgcggcgag cggtatcagc tcactcaaag gcggtaatac 16800 
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ggttatccac agaatcaggg gataacgcag gaaagaacat gtgagcaaaa ggccagcaaa 168 60 

aggccaggaa ccgtaaaaag gccgcgttgc tggcgttttt ccataggctc cgcccccctg 16920 

acgagcatca caaaaatcga cgctcaagtc agaggtggcg aactcocgaea ggactntaaa 16980 

gataccaggc gttfcccccct ggaagctccc tcgtgcgctc tcctgttccg accctgccgc 17040 

ttaccggata cctgtccgcc tttctccctt cgggaagcgt ggcgcttttc cgctgcataa 17100 

ccctgcttcg gggtcattat agcgattttt tcggtatatc catcctfcttt cgcacgatat 17160 

acaggatttt gccaaagggt tcgtgtagac tttccttggt gtatccaacg gcgtcagccg 17220 

ggcaggatag gtgaagtagg cccacccgcg agcgggtgtt ccttcttcac tgfcccctfcat 17280 

tcgcacctgg cggtgctcaa cgggaatcot gctctgcgag gctggccggc taccgccggc 17340 

gtaacagatg agggcaagcg gatggctgat gaaaccaagc caaccaggaa gggcagccca 17400 

cctatcaagg tgtactgcct tccagacgaa cgaagagcga ttgaggaaaa ggcggcggcg 17460 

gccggcatga gcctgtcggc ctacctgctg gccgtcggcc agggctacaa aatcacgggc 17520 

gtcgtggact atgagcacgt ccgcgagctg gcccgcatca atggcgacct gggccgcctg 17 580 

ggcggcctgc tgaaactcfcg gcfccaccgac gacccgcgca cggcgcggtt cggtgatgcc 17640 

acgatcctcg ccctgctggc gaagatcgaa gagaagcagg acgagcttgg caaggtcatg 17700 

atgggcgtgg tccgcccgag ggcagagcca tgactttttt agccgctaaa acggccgggg 177 60 

ggtgcgcgtg attgccaagc acgtccccat gcgctccatc aagaagagcg acttcgcgga 17820 

gctggbgaag tacatcaccg acgagcaagg caagaccgag cgcc'tttgcg acgctca 17877 

<210> 38 
<211> 17238 
<212> DKFA 
<213> Artificial 
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<220> 

<223> Plasmid 



<220> 

<221> misc_feature 

<222> {10264) {10264} 

<223> n is a, c, g, or t 

<220> 

<221> misc_feature 

<222> (10472) . . {10472} 

<223> n is a, c, g, or t 

<220> 

<221> misc_feature 

<222> (10563) .. (10563) 

<223> n is a, c, g, or t 

<400> 38 

ccgggctggt tgccctcgcc gctgggctgg cggccgtcfca tggccctgca aacgcgccag 60 
aaaogecgte gaagr.ciertgt gcgaaacacc crcacrccgccg gcgttgtgga tacctcgcgg 
aaaacttggc cctcactgac agatgagggg cggacgttga cacttgaggg gccgactcac 
ccggcgcggc gttgacagat gaggggcagg ctcgatttcg gccggcgacg tggagctggc 240 
cagcctcgca aatcggcgaa aacgcctgat tttacgcgag tttcccacag afcgatgtgga 
caagcctggg gataagtgcc ctgcggtatt gacacttgag gggcgcgact actgacagat 
gaggggcgcg atccttgaca cttgaggggc agagtgctga cagatgaggg gcgcacctat 
tgacatttga ggggctgtcc acaggcagaa aatccagcat ttgcaagggt ttccgcccgt 480 
ttfctcggcca ccgctaacot gtcttfctase etgetefct-.fcaa accaatattt ataaaccttcr 540 
tttttaacca gggctgcgcc ctgtgcgcgt gaccgcgcac gccgaagggg ggtgcccccc 
cttctcgaac cctcccggcc cgctaacgcg ggcctcccat ccccccaggg gctgcgcccc 



120 

180 



300 



360 



420 



600 
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tcggccgcga acggcctcac cccaaaaatg gcagcgctgg cagtccttgc cattgccggg 720 
atcggggcag taacgggatg ggcgatcagc ccgagcgcga cgcccggaag cattgacgtg 780 
ccgcaggtgc tggcatcgac attcagcgac caggtgccgg gcagfcgaggg cggcggcctg 840 
ggtggcggcc tgcccttcac ttcggccgtc ggggcattca cggacbtcat ggcggggccg 900 
rjnaattttta ccttacrcrcat tcttacrcata gtggtcgcgg gtgccgtgct cgtgttcggg 960 

ggtgcgataa acccagcgaa ccatttgagg tgataggtaa gattataccg aggtatgaaa 1020 

acgagaattg gacctttaca gaattactct atgaaguyuc atatttaaaa agctaccaag 1080 

acgaagagga tgaagaggat gaggaggcag attgccttga atatattgac aatactgata 1140 

agataatata tcttttatat agaagatatc gccgtatgta aggatttcag ggggcaaggc 1200 

ataggcagcg cgcttatcaa tatatctata gaatgggcaa agcataaaaa cttgcatgga 1260 

ctaatgcttg aaacccagga caataacctt atagcttgta aattctatca taafctgggta 1320 

atgactccaa cttattgata gtgttttatg ttcagataat gcccgatgac tttgtcatgc 1380 

agctccaccg attttgagaa cgacagcgac ttccgtccca gccgtgccag gtgctgcctc 1440 

agattcaggt tatgccgctc aattcgctgc gtatatcgct tgctgattac gtgcagcttt 1500 

cccttcaggc gggattcata cagcggccag ccatccgtca tccatatcac cacgtcaaag 1560 

ggtgacagca ggctcataag acgccccagc gtcgccatag tgcgttcacc gaatacgtgc 1620 
gcaacaaccg tcttccggag actgtcatac gcgtaaaaca gccagcgctg gcgcgattta 1680 
gccccgacat agccccactg ttcgtccatt tccgcgcaga cgatgacgtc actgcccggc 1740 
tgtatgcgcg aggttaccga ctgcggcctg agttttttaa gtgacgtaaa atcgtgttga 1800 
ggccaacgcc cataatgcgg gctgttgccc ggcatccaac gccattcatg gccatatcaa 1860 
tgattttctg gtgcgtaccg ggttgagaag cggtgtaagt gaactgcagt tgccatgttt 1920 
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tacggcagtg agagcagaga tagcgctgat gtccggcggt gcttttgccg ttacgcacca 1980 

ccccgtcagt agctgaacag gagggacagc tgatagacac agaagccacfc ggagcacctc 2040 

aaaaacacca tcatacacta aatcagtaag ttggcagcat cacccataat tgtggtttca 2100 

aaatcggctc cgtcgatact atgttatacg ccaactttga aaacaacttt gaaaaagctg 2160 

ttttctggta tttaaggttt tagaatgcaa ggaacagtga attggagttc gtcttgttat 2220 

aattagcttc ttggggtafcc tttaaatact gtagaaaaga ggaaggaaat aataaatggc 2280 

taaaatgaga atatcaccgg aattgaaaaa actgettuycia aaataccgct gcgtaaaaga 2340 

tacggaagga atgtctcctg ctaaggtata taagctggtg ggagaaaatg aaaacctata 2400 

tttaaaaatg acggacagcc ggtataaagg gaccacctat gatgtggaac gggaaaagga 2460 

catgatgcta tggctggaag gaaagctgcc tgttccaaag gtcctgcact ttgaacggca 2520 

tgatggctgg agcaatctgc tcatgagtga ggccgatggc gtcctfctgcfc cggaagagta 2580 

tgaagatgaa caaagccctg aaaagattat cgagctgfcat gcggagtgca tcaggctctt 2640 

tcactccatc gacatatcgg attgtcccta tacgaatagc ttagacagcc gcttagccga 2700 

attggattac ttactgaata acgatctggc cgatgtggat tgcgaaaact gggaagaaga 27 60 

cactccattt aaagatccgc gcgagctgta tgatttttta aagacggaaa agcccgaaga 2820 

ggaacttgtc ttttcccacg gcgacctggg agacagcaac atctttgtga aagatggcaa 2880 

agtaagtggc tttattgatc ttgggagaag cggcagggcg gacaagtggt atgacattgc 2940 

cttctgcgtc cggtcgatca gggaggatat cggggaagaa cagtatgtcg agctattttt 3000 

tgacttactg gggatcaagc ctgattggga gaaaataaaa tattatattt tactggatga 3060 

atbgttttag tacctagatg tggcgcaacg atgccggcga caagcaggag cgcaccgact 3120 

tcttccgcat caagtgtttt ggctctcagg ccgaggccca cggcaagtat ttgggcaagg 3180 
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ggtcgctggt attcgtgcag ggcaagattc ggaataccaa gtacgagaag gacggccaga 3240 

cggtctacgg gaccgacttc attgccgata aggtggatta tctggacacc aaggcaccag 3300 

gcgggtcaaa tcaggaataa gggcacattg ccccggcgtg agtcggggca atcccgcaag 3360 

gagggtgaat gaatcggacg tttgaccgga aggcatacag gcaagaactg afccgacgcgg 3420 

ggttttccgc cgaggatgcc gaaaccatcg caagccgcac cgtcatgcgt gcgecccgcg 3480 

aaaccttcca gtccgtcggc tcgatggtcc agcaagctac ggccaagatc gagcgcgaca 3540 

gcgtgcaact ggctccCCCt gccctgeuug egccatcggc cgccgtggag cgttcgcgtc 3S00 

gtctcgaaca ggaggcggca ggtttggcga agtcgatgac catcgacacg cgaggaacba 3660 

tgacgaccaa gaagcgaaaa accgccggcg aggacctggc aaaacaggtc agcgaggcca 3720 

agcaggccgc gttgctgaaa cacacgaagc agcagatcaa ggaaatgcag ctttcctfcgt 3780 

tcgatattgc gccgtggccg gacacgatgc gagcgatgcc aaacgacacg gcccgctctg 3840 

ccctgttcac cacgcgcaac aagaaaatcc cgcgcgaggc gctgcaaaac aaggtcattt 3900 

tccacgtcaa caaggacgtg aagatcacct acaccggcgt cgagctgcgg gccgacgatg 3960 

acgaacfcggt gtggcagcag gtgttggagt acgcgaagcg cacccctatc ggcgagccya 4020 

tcaccttcac gttctacgag ctttgccagg acctgggctg gtcgatcaat ggccggtatt 4080 

acacgaaggc cgaggaatgc ctgtcgcgcc tacaggcgac ggcgatgggc ttcacgtccg 4140 

accgcgttgg gcacctggaa tcggtgtcgc tgctgcaccg ctfcccgcgtc ctggaccgtg 42 00 

gcaagaaaac gtcccgttgc caggtcctga tcgacgagga aatcgtcgtg ctgtttgctg 4260 

gcgaccacta cacgaaattc atatgggaga agtaccgcaa gctgtcgccg acggcccgac 4320 

ggatgttcga ctatttcagc tcgcaccggg agccgtaccc gctcaagctg gaaaccttcc 4380 

gcctcatgtg cggatcggat tccacccgcg tgaagaagtg gcgcgagcag gtcggcgaag 4440 
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cctgcgaaga gttgcgaggc agcggcctgg tggaacacgc ctgggtcaat gatgacctgg 4500 

tgcattgcaa acgctagggc cttgtggggt cagttccggc tgggggttca gcagccagcg 4560 

ctttacfcggc atttcaggaa caagcgggca ctgctcgacg cacttgcttc gctcagtatc 4620 

gctcgggacg cacggcgcgc tctacgaact gccgataaac agaggattaa aattgacaat 4680 

tgtgattaag gctcagattc gacggcttgg agcggccgac gtgcaggatfc tccgcgagat 4740 

ccgattgtcg gccctgaaga aagctccaga gatgttcggg tccgtttacg agcacgagga 4800 

gaaaaagccc afcggaggcgt tcgctgaacg gttgcgagat gccgtggcah tcggcgccta 4860 

catcgacggc gagatcattg ggctgtcggt cttcaaacag gaggacggcc ccaaggacgc 4920 

tcacaaggcg catctgtccg gcgttttcgt ggagcccgaa cagcgaggcc gaggggtcgc 4980 

cggtatgctg ctgcgggcgb tgccggcggg tttattgctc gtgatgatcg tccgacagat 5040 

tocaacggga atctggt-.gga fcgcgcatctt catcctccrgc acacttaata tttcgctatt 5100 

ctggagcttg ttgtttattt cggtctaccg cctgccgggc ggggtcgcgg cgacggtagg 5160 

cgctgtgcag ccgctgatgg tcgtgttcat ctctgccgct ctgctaggta gcccgatacg 5220 

attgatggcg gtcctggggg ctatttgcgg aactgcgggc gtggcgctgt tggtgttgac 5280 

accaaacgca gcgctagatc ctgtcggcgt cgcagcgggc ctggcggggg cggtttccat 5340 

ggcgttcgga accgtgctga cccgcaagtg gcaacctccc gtgcctctgc taacctfctac 5400 

cgccbggcaa ctggcggccg gaggacttct gctcgttcca gtagctttag tgtttgatcc 5460 

gccaatcccg atgcctacag gaaocaatgt tctcggeeteg gcgtggetcg g«efcgafccgg 5520 

agcgggttta acctacttcc tttggttccg ggggatctcg cgactcgaac ctaoagttgt 5580 

ttccttactg ggctttctca gccccagatc tggggtcgafc cagccgggga tgcatcaggc 5640 
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cgacagtcgg aacttcgggt ccccgacctg taccattcgg tgagcaatgg ataggggagt 5700 

fcgatatcgtc aacgttcact tctaaagaaa tagcgccact cagcttcctc agcggcttta 576.0 

tccagcgatt tcctattatg tcggcatagte tctcaagatc gacagcctgt cacggttaag 5820 

cgagaaatga ataagaaggc tgataattcg gatctctgcg agggagatga tatttgatca 5880 

caggcagcaa cgctctgtca tcgttacaat caacatgcta ccctccgcga gatcatccgt 5940 

gtttcaaacc cggcagctta gttgccgttc ttccgaatag catcggtaac atgagcaaag 6000 

tctgccgcct tacaacggct ctcccgctga cgccgtcccg gactgatggg ctgcctgfcat 6060 

cgagtggtga ttttgfcgccg agctgccggt cggggagctg ttggctggct ggtggcagga 6120 

tatattgtgg tgtaaacaaa ttgacgctta gacaacttaa taacacattg cggacgtttt 6180 

taatgtactg gggtggtttt tcttttcacc agtgagacgg gcaacagctg attgcccttc 6240 

accgcctggc cctgagagag ttgcagcaag cggtccacgc tggtttgccc cagcaggcga 6300 

naafcecfcafct tgatggtggt tccgaaatcg gcaaaatccc ttataaatca aaagaatagc 6360 

ccgagatagg gttgagtgtt gttccagttt ggaacaagag tccactatta aagaacgtgg 6420 

actccaacgt caaagggcga aaaaccgtct atcagggcga tggcccacta cgtgaaccat 6480 

cacccaaatc aagttttttg gggtcgaggt gccgtaaagc actaaatcgg aaccctaaag 6540 

ggagcccccg atttagagct fcgacggggaa agccggcgaa cgtggcgaga aaggaaggga 6600 

agaaagcgaa aggagcgggc gccattcagg ctgcgcaact gttgggaagg gcgatcggtg 6660 

cgggcctctt cgctattacg ccagctggcg aaagggggat gtgctgcaag gcgattaagt 6720 

tgggfcaaogo cagggttttc ccsgfccapga egtfcgtaaaa cgacggccag tgaattcgag 6780 

ctcggtaccc ggggafccttt cgacactgaa atacgtcgag cctgctccgc ttggaagcgg 6840 
cgaggagcct cgtcctgtca caactaccaa catggagtac gataagggcc agttccgcca 6900 
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gctcattaag agccagtfcca tgggcgttgg catgatggcc gtcatgcatc tgtacttcaa 6960 

gtacaccaac gctcttctga tccagtcgat catccgctga aggcgctttc gaatctggtt 702 0 

aagatccacg tcttcgggaa gecagcgact ggtgacctcc agcgtccctt taaggctgcc 7080 

aacagctttc tcagccaggg ccagcccaag accgacaagg cctccctcca gaacgccgag 7140 

aagaactgga crascjtggtgt caaggaggag taagctcctt attgaagtcg gaggacggag 7200 

cggtgtcaag aggatattct tcgactctgt attatagata agatgatgag gaattggagg 7260 

tagcatagct tcatttggat ttgctttcca ggctgagact ctagcttgga gcatagaggg 7320 

tcctttggct ttcaatattc tcaagtatct cgagtttgaa cttattccct gtgaaccttt 7380 

tattcaccaa tgagcattgg aatgaacatg aatctgagga ctgcaatcgc catgaggttt 7440 

tcgaaataca tccggatgtc gaaggcttgg ggcacctgcg ttggttgaat ttagaacgtg 7500 

gcactattga tcatccgata gctctgcaaa gggcgttgca caatgcaagt caaacgtfcgc 7560 
tagoagttac aggtggaahg ttatgatgag cattgtatta aatcaggaga tabagcatga 7620 
tctctagtta gctcaccaca aaagtcagac ggcgtaacca aaagtcacac aacacaagct 7680 
gtaaggattt cggcacggct acggaagacg gagaagccac cttcagtgga ctcgagtacc 7740 
atttaattct atttgtgttt gatcgagacc taatacagcc cctacaacga ccatcaaagt 7800 
cgtatagcta ccagtgagga agtggactca aatcgacttc agcaacatct cctggataaa 7860 
ctttaagcct aaactataca gaataagata ggtggagagc ttataccgag ctcccaaatc 7920 
tgtccagatc atggttgacc ggtgcctgga tcthcctata gaatcatcct tattcgtfcga 7980 
cctetgctgat tctggagtga ocoagagggt eatgactfega gcctaaaatc cgccgcctcc 8040 
accatttgta gaaaaatgtg acgaactcgt gagctctgta cagtgaccgg tgactctttc 8100 
tggcatgcgg agagacggac ggacgcagag agaagggctg agtaataagc cactggccag 8160 
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acagctctgg cggctctgag gtgcagtgga tgattattaa fcccgggaccg gccgcccctc 8220 

cgccccgaag tggaaaggct ggtgtgcccc tcgfctgacca agaatctatt gcatcatcgg 8280 

agaatatgga gcttcatcga atcaccggca gtaagcgaag gagaatgtga agccaggggt 8340 

gtatagccgt cggcgaaafca gcatgccatt aacctaggta cagaagtcca attgcttccg 8400 

atctootaaa asattcaccra gatagtacct tctccgaagt aggtagagcg agtacccggc 8460 

gcgtaagctc cctaattggc ccatccggca tctgtagggc gtccaaatat cgtgcchctc 8520 _ 

ctgctttgcc cggtgtatga aaccggaaag gccgctcagg agctggccag cggcgcagac 8580 

cgggaacaca agctggcagt cgacccatcc ggtgctctgc actcgacctg ctgaggtccc 8640 

tcagtocctg gtaggcagct ttgccccgtc tgtccgcccg gtgtgtcggc ggggttgaca 8700 

aggtcghtgc gtcagtccaa catttgttgc catattttcc tgctctccco accagctgct 8760 

cttttctttt ctctttcttt tcccatcttc agtatattca tcttcccatc caagaacctt 8820 

tatttcccct aagtaagtac tttgctacat ccatactcca tccttcccat cccttattcc 8880 

tttgaacctt tcagttcgag ctttcccact tcatcgcagc ttgactaaca gctaccccgc 8940 

ttgagcagac atcaccatgc ctgaactcac cgcgacgtct gtcgagaagU ttctgatcga 9000 

aaagttcgac agcgtctccg acctgatgca gctctcggag ggcgaagaat ctogtgcttt 9060 

cagcttcgat gtaggagggc gtggafcatgt cctgcgggta aatagctgcg ccgatggttt 9120 
cfcacaaagat cgttatgttt atcggcactt tgcatcggcc gcgctcccga ttccggaagt 9180 
gcttgacatt ggggaatfcca gcgagagcct gacctattgc atctcccgcc gtgcacaggg 9240 
tgtcacgttg caagacctgc ctgaaaccga actgcccgct gttctgcagc cggtcgcgga 9300 
ggccatggat gcgatcgctg cggccgatct tagccagacg agcgggttcg gcccattcgg 9360 
. accgcaagga atcggtcaat acactacatg gcgtgatttc atatgcgcga ttgctgatcc 9420 
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ccatgtgtat cactggcaaa ctgtgatgga cgacaccgtc agtgcgtccg tcgcgcaggc 9480 

tctcgatgag ctgatgcttt gggccgagga ctgccccgaa gtccggcacc tcgtgcacgc 9540 

ggatttcggc tccaacaatg tcctgacgga caatggccgc ataacagcgg fccafctgactg 9600 

gagcgaggcg atgttcgggg attcccaata cgaggtcgcc aacatcttct tctggaggcc 9660 

gtggttggct tgtatggagc agcagacgcg ctacttcgag cggaggcatc cggagcttgc 972 0 

aggatcgccg cggctccggg cgtatatgct ccgcattggt cttgaccaac tctatcagag 9780 

cttggttgac ggcaatttcg atgatgcagu LCygyegcag ggtcgettgcg acgcaatcgfc 9840 

ccgatccgga gccgggactg tcgggcgtac acaaatcgcc cgcagaagcg cggccgtctg 9900 

gaccgatggc tgtgtagaag tactcgccga tagtggaaac cgacgcccca gcactcgtcc 9960 

gagggcaaag gaatagagta gatgccgacc gcgggatcga tccacttaac gttactgaaa 10020 

tcatcaaaca gcttgacgaa tctggatata agatcgttgg tgtcgatghc agctccggag 10080 

ttgagacaaa tggtgttcag gatctcgata agatacgttc atttghccaa gcagcaaaga 10140 

gtgccttcta gtgatttaat agctccatgt caacaagaat aaaacgcgtt ttcgggttta 10200 

cctcttccag atacagctca tctgcaatgc attaatgcat tgactgcaac ctagtaacgc 102C0 

cttncaggct ccggcgaaga gaagaatagc ttagcagagc tattttcatt ttcgggagac 10320 

gagatcaagc agatcaacgg tcgtcaagag acctacgaga ctgaggaatc cgctcttggc 10380 

tccacgcgac tatatatttg tctctaattg tactttgaca tgctcctctt ctttactctg 10440 

atagctfcgac tatgaaaatt ccgtcaccag cncctgggtt cgcaaagata attgcatgtt 10500 

tcttccttga actctcaagc ctacaggaca cacattcatc gtaggtataa acctcgaaat 10560 

canttcctac taagatggta tacaatagta accatgcatg gttgcctagt gaatgctccg 10620 

taacacccaa tacgccggcc gaaacttttt tacaactctc ctafcgagtcg tttacccaga 1U680 
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atgcacaggt acacttgttt agaggtaatc cttctttcta gctagaagtc ctcgtgtact 10740 

gtgtaagcgc ccactccaca tctccactcg acctgcaggc atgcaagctt ctaccgcttg 10800 

gaccagtcca gttccaggac cagtcgctcc acctcctceg ccgcacctgg aatgtgctgc 10860 

agctcctgtg gacccaagaa cataccccag ggcgcgccac cgtacttgcc gctgtggtgt 1092 0 

agctggtggg ccactgtcag gcgcttcatg tagggcaggc cagcgatggg cccggtggga 10980 

aagcgcctgt gcaccaggcc atcgtgtaca aacatatatg ccatgccgta tagcgtgatg 11040 

CCCagcCCCg ctccaaayca ggocgccccc aggaogttgg gcagcoagaa gcoaaaggfca 11100 

cacaggagca tggcgggcag tccattgatg attgcaaaca agtcgttggc ttcaaagggfc 11160 

ccagtgcgag gtgtgtggtg gcfccttgtgc agcagccagc ccagaggcga ctcatgccag 11220 

atggctttgt gtgcatagcg ggcatacatc tccatgccga gcgcgccacc aaccaccaag 11280 

aggagagtgc cagccacttc aceccatggc actgcgccgc ccacggtcat gtgcatggca 11340 

aatctcaggt aggtggcgaa gatggcaatg cctgacacgc caattgatgc tgcaatggcg 11400 

gcagcctggt atgacagctg ctcccgtttg cgccgggcac gacgctctgc gatagcccgg 11460 

tcaagctgct ggagtgctac atcggcgctg tgctcatcgc cygcgccggc agcctgcacg 11520 

gttcccagcg cctcctctgt ctgtggtgct gccactcgca gccgaactaa cgagcaccgc 11580 

tgagcatgca ggcagacttt gggccgcgtg atgtcgcggg ctagttcaac gcggcgggcc 11640 
ttgacgctga ttgactgcag cttcgacagc atagagataa aataaaaaga gaagaaaaga 
aagtttgtac aatttctttt tgtttatata acatacacgc tatgtcaaca tttagaataa 
gggggaaaaa atcttccatc atattcgaat gcacaagatt atttctttgt tcgctctttt 
tggtcgggtc atcgagattt agagtgtaat caaagatact gtcatctcga gagcgttgca 

caggctgctg tttgccaaat tggatgtttg ccgaattagt aaaaeacgca agcatttctt 11940 
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acctttccgc tcccttttcc taattctccc aaagactaaa tgaggaaaga taaaggacaa 12000 

agaaaatgta aagacaaaga aattgaaaac gatataaact tgcagcacgt aagaccaaag 12060 

caaattggta actattcttg tgtacaaaca tgtataaaaa aaaacttttt tttgctcctg 12120 

gaggacaaaa tttcaaactc cttgaagaag attgcttgta tatctatcat ■ atgcatatat 12180 

catatcgatg gaaaaagaaa gfccaggcatg tatttataaa aagaagaatg tgccatgctt 12240 

ccgaatfctct tttcactttc ttttccttat ctattttaat ctcaagcttg gcgtaafccat 123 

ggtcatagct gtttcctgtg tgaaattyLL atecgctcac aattccacac aacataogag 123 60 

ccggaagcat aaagtgtaaa gcchggggtg cctaatgagt gagctaactc acattaatfcg 12420 

cgttgcgctc actgcccgct ttccagtcgg gaaacctgtc gtgccagctg cattaatgaa 12480 

tcggccaacg cgcggggaga ggcggtttgc gtattgggcc aaagacaaaa gggcgacatt 12540 
aaaaogatfcg agggagggaa ggtaaatatt gacggaaatt attcattaaa ggtgaattat 
caccgtcacc gacttgagcc atttgggaat tagagccagc aaaatcacca gtagcaccat 
taccattagc aaggccggaa acgtcaccaa tgaaaccatc gatagcagca ccgtaatcag 
tagcgacaga atcaagtttg cctttagcgt cagactgtag cgcgttttca tcggcatttt 
cggtcatagc ccccttatta gcgtttgcca tcttttcata atcaaaatca ccggaaccag 12840 
agccaccacc ggaaccgcct ccctcagagc cgccaccctc agaaccgcca ccctcagagc 12900 
caccaccctc agagccgcca ccagaaccac caccagagcc gccgccagca ttgacaggag 12960 
gcccgatcta gtaacataga tgacacogog ogogataatt tatcrifcagfet tgcgcgctat 13020 
attttgtttt ctatcgcgta ttaaatgtat aattgcggga ctctaatcat aaaaacceat 13080 
cfccataaata acgtcatgca ttacatgtta attattacat gcttaacgta attcaacaga 13140 
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aattatatga taatcatcgc aagaccggca acaggattca atcttaagaa actttatbgc 13200 

caaatgtttg aacgatcggg gatcatccgg gtctgtggcg ggaactccac gaaaatatcc 13260 

gaacgcagca agatafccgcg gtgcatcfccg gtcttgcctg ggcagtcgco gccgacgccg 13320 

ttgatgtgga cgccgggccc gatcatattg tcgctcagga tcgtggcgtt gtgcttgtcg 13380 

erccgttgctg tcgtaatgat atcggcacct tcgaccgcct gttccgcaga gatcccgtgg 13440 

gcgaagaact ccagcatgag atccccgcgc tggaggatca tccagccggc gtcccggaaa 13500 

acgattccga agcccaacct ttcafcagaag gcggcggtgg aatcgaaatc tcgtgatggc 13560 

aggttgggcg tcgcttggtc ggtcatttcg aaccccagag tcccgctcag aagaactcgt 13620 

caagaaggcg atagaaggcg atgcgctgcg aatcgggagc ggcgataccg taaagcac'ga 13 680 

ggaagcggtc agcccattcg ccgccaagct cttcagcaat atcacgggta gccaacgcta 13740 

tgbcctgata gcggtccgcc acacccagcc ggccacagtc gatgaatcca gaaaagcggc 13800 

eattttooac eafco»fcafcfce ggcaagcacrg catcgccatg ggtcacgacg agatcatcgc 13860 

cgtcgggcat gcgcgccttg agcctggcga acagttcggc tggcgcgagc ccctgatgct 13920 

cttcgtccag atcatcctga tcgacaagac cggcttccat ccgagtacgt gctcgctcga 13980 

tgcgatgttt cgcttggtgg tcgaatgggc aggtagccgg atcaagcgta tgcagccgcc 14040 

gcattgcatc agccatgatg gatacfcttct cggcaggagc aaggtgagat gacaggagat 14100 

cctgccccgg cacttcgccc aatagcagcc agtcccttcc cgcttcagtg acaacgtcga 14160 

gcacagctgc gcaaggaacg cccgtcgtgg ccagccacga tagccgcgct gcatcgtcct 14220 

gcagttcatfc oagggoaoog gaaaggfccgg tcttgacaaa aagaacdggg egeecetgog 14-280 

ctgacagccg gaacacggcg gcatcagagc agccgattgt ctgttgtgcc cagtcatagc 14340 

cgaatagcct ctccacccaa gcggccggag aacctgcgtg caatccatct tgttcaatca 14400 
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tgcgaaacga tccagatccg gtgcagatta tttggattga gagtgaatat gagactctaa 14460 

ttggataccg aggggaattt atggaacgtc agtggagcat ttttgacaag aaatatttgc 14520 

tagctgatag tgaccttagg cgactfcttga acgcgcaata atggtttctg acgtatgtgc 14580 

ttagctcatt aaactccaga aacccgcggc tgagtggctc cttcaacgtt gcggttctgt 14640 

cagttccaaa cgtaaaacgg cttgtcccgc gtcatcggcg ggggtcataa cgtgactccc 14700 

ttaattctcc gctcatgatc agattgtcgt ttcccgcctt cagtttaaac tatcagtgtt 14760 

tgacaggata tattggcggg taaacctaag agaaaagagc gtttattaga ataatcggat 14820 

atttaaaagg gcgtgaaaag gtttatccgt tcgtccattt gtatgtgcat gccaaccaca 14880 

gggttcccca gatctggcgc cggccagcga gacgagcaag attggccgcc gcccgaaacg 14940 

atccgacagc gcgcccagca caggtgcgca ggcaaattgc accaacgcat acagcgccag 15000 

cagaatgcca tagtgggcgg tgacgtcgtt cgagtgaacc agatcgcgca ggaggcccgg 15060 

cagcaccggc ataatcagac cqatgccgac agcgtcgagc gcgacagtgc tcagaattac 15120 

gatcaggggt atgttgggtt tcacgtctgg cctccggacc agcctccgct ggtccgattg 15180 

aacgcgcgga ttctttatca cfcgataagtt ggtggacata ttatgtttat cagtgataaa 15240 

gtgtcaagca tgacaaagtt gcagccgaat acagtgatcc gtgccgccct ggacctgttg 153 00 

aacgaggtcg gcgtagacgg tctgacgaca cgcaaactgg cggaacggtt gggggttcag 15360 

cagccggcgc tttactggca cttcaggaac aagcgggcgc tgctcgacgc actggccgaa 15420 

gccatgctgg cggagaatca tacgcattcg gtgccgagag ccgacgacga ctggcgctca 15480 

tttctgafccg ggaatgeecg cagctfccagg nsggcgetgc tcgcctaccg cgatggcgcg 15540 

agcatccatg ccggcacgcg accgggcgca ccgcagatgg aaacggccga cgcgcagctt 15600 

cgcttcctct gcgaggcggg tttttcggcc ggggacgccg tcaatgcgct gatgacaatc 15660 
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agctacttca ctgttggggc cgtgcttgag gagcaggccg gcgacagcga fcgccggcgag 15720 

cgcggcggca ccgttgaaca ggctccgctc tcgccgctgt tgcgggccgc gatagacgcc 15780 

ttcgacgaag ccggtccgga cgcagcgttc gagcagggac tcgcggtgat tgtcgatgga 15840 

ttggcgaaaa ggaggctcgt tgtcaggaac gttgaaggac cgagaaaggg tgacgattga 15900 

tcaggaccgc tgccggagcg caacccactc actacagcag agccatgtag acaacatccc 15960 

ctcccccttt ccaccgcgtc agacgcccgt agcagcccgc tacgggcttt ttcatgccct 16020 

gccctagcgt ccaagcctca cggccgcgct cggcctctct ggcggccttc tggcgctctt 16080 

ccgcttcctc gctcactgac fccgctgcgct cggtcgttcg gctgcggcga gcggtatcag 16140 

ctcactcaaa ggcggtaata cggttatcca cagaatcagg ggataacgca ggaaagaaca 16200 

tgtgagcaaa aggccagcaa aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt 16260 

tccataggct ccgcccccct gacgagcatc acaaaaatcg acgctcaagt cagaggtggc 16320 

gaaacccgac aggactataa agataccagg cgtttccccc tggaagctcc ctcgtgcgct 16380 

ctcctgttcc gaccctgccg cttaccggat acctgtccgc cttfcctccct tcgggaagcg i6440 

fcggcgctttt ccgctgcata accctgcttc ggggtcatta tagcgatttt tttrggtatat 16500 

ccatcctttt tcgcacgata tacaggattt tgccaaaggg fctcgtgtaga ctttccttgg 16560 

tgtatccaac ggcgtcagcc gggcaggata ggtgaagtag gcccacccgc gagcgggtgt 16620 

tccttcttca ctgtccctta ttcgcacctg gcggtgctca acgggaatcc tgctctgcga 16680 

ggctggccgg ctaccgccgg cgtaacagat gagggcaagc ggatggctga tgaaaccaag 16740 

ccaaccagga agggcagccc acctatcaag gtgtactgcc ttccagacga acgaagagcg 16800 

attgaggaaa aggcggcggc ggccggcatg agcctgtcgg cctacctgct ggccgtcggc 16860 

cagggctaca aaatcacggg cgtcgtggac tatgagcacg tccgcgagct ggcccgcatc 16920 
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aatggcgacc tgggccgcct gggcggcctg ctgaaactct ggctcaccga cgacccgcgc 16980 

acggcgcggt tcggtgatgc cacgatcctc gccctgctgg cgaagatcga agagaagcag 17040 

gacgagcttg gcaaggtcat gafcgggcgtg gtccgcccga gggcagagcc atgacttttt 17100 

tagccgctaa aacggccggg gggtgcgcgt gattgccaag cacgtcccca tgcgctccat 17160 

caagaagagc gacttcgcgg agctggtgaa gtacatcacc gacgagcaag gcaagaccga 17220 

gcgcctttgc gacgctca 17238 



<210> 39 

<211> 17238 

<212> DNA 

<213> Artificial 

<220> 

<223> Plasmid 



<220> 

<221> misc_feature 

<222> (10264) .. (10264) 

<223> n is a, c, g, or t 

<220> 

<221> misc_feature 

<222> (10472) . . (10472) 

<223> n is a, c, g, or t 

<220> 

<221> Hiisc_£eature 

<222> (10563) .. (10563) 

<:223> n is a, c, g, or t 

<400> 39 

ccgggctggt tgccctcgcc gctgggctgg cggccgtcta tggccctgca aacgcgccag 60 
aaacgccgtc gaagccgtgt gcgagacacc gcggccgccg gcgttgtgga fcacctcgcgg 12 0 
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aaaacttggc cctcactgac agatgagggg cggacgttga cacttgaggg gccgactcac 180 

ccggcgcggc gttgacagat gaggggcagg ctcgatttcg gccggcgacg tggagctggc 240 

cagcctcgca aatcggcgaa aacgcctgat tttacgcgag tttcccacag atgatgtgga 300 

caagcctggg gataagtgcc ctgcggtatt gacacttgag gggcgcgact actgacagat 360 

gaggggcgcg atccttgaca cttgaggggc agagtgctga cagatgaggg gcgcacctat 420 

tgacatttga ggggctgtcc acaggcagaa aatccagcat ttgcaagggt ttccgcccgt 480 

ttttcggcca ccgctaacct gtcttttaac ctgctt.UL<aa. acgaatattt atasoccttg 540 

tttttaacca gggcbgcgcc ctgtgcgcgt gaccgcgcac gccgaagggg ggtgcccccc 600 

cttctcgaac cctcccggcc cgctaacgcg ggcctcccat ccccccaggg gctgcgcccc 660 

tcggccgcga acggcctcac cccaaaaatg gcagcgctgg cagtccttgc cattgccggg 720 

atcggggcag taacgggatg ggcgatcagc ccgagcgcga' cgcccggaag cattgacgtg 780 

ccgcaggtgc tggcatcgac attcagcgac caggtgccgg gcagtgaggg cggcggcctg 840 

ggtggcggcc tgcccttcac ttcggccgtc ggggcattca cggacttcat ggcggggccg 900 

gcaattttta ccttgggcat tcttggcata gtggtcgcgg gtgccgtgct cgtgttcggg 960 

ggtgcgataa acccagcgaa ccatttgagg tgataggfcaa gattataccg aggtatgaaa 1020 

acgagaattg gacctttaca gaattactct atgaagcgcc atatttaaaa agctaccaag 1080 

acgaagagga tgaagaggat gaggaggcag attgccttga atatattgac aatactgata 1140 

agataatata tcttttatat agaagatatc gccgtatgta aggatttcag ggggcaaggc 1200 

ataggcagcg cgcttatcaa tatatctata gaatgggcaa agcataaaaa cttgcatgga 1260 

ctaatgcttg aaacccagga caataacctt atagcttgta aattctatca taatfcgggta 1320 

atgactccaa cttattgata gtgttttatg ttcagataat gcccgatgac tttgtcatgc 13 BO 
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agctccaccg attttgagaa cgacagcgac ttccgtccca gccgtgccag gtgctgcctc 1440 

agattcaggt tatgccgctc aattcgctgc gtatatcgct tgctgattac gtgcagcttt 1500 

cccttcaggc gggattcata cagcggccag ccatccgtca tccatatcac cacgtcaaag 1560 

ggtgacagca ggctcataag acgccccagc gtcgccatag tgcgttcacc gaatacgtgc 1620 

gcaacaaccg tcttccggag actgtcatac gcgtaaaaca gccagcgctg gcgcgattta 1680 

gccccgacat agccccactg ttcgtccatt tccgcgcaga cgatgacgtc actgcccggc 1740 

tgtatgcgcg aggttaccga ctgcggcctg sigLt-ttttaa gfcgacgtaaa atcgtgttga 1800 

ggccaacgcc cataatgcgg gctgttgccc ggcatccaac gccattcatg gccatatcaa 1860 

tgattttctg gtgcgtaccg ggttgagaag cggtgtaagt gaactgcagt tgccatgttt 1320 

tacggcagtg agagcagaga tagcgctgat gtccggcggt gcttttgccg fctacgcacca 1980 

occcgtcagt agctgaarsg gagggacagc tgatagacac aaaaaccact ggagcacctc 2040 

aaaaacacca tcatacacta aatcagtaag ttggcagcat cacccataat tgtggtttca 2100 

aaatcggctc cgtcgatact atgttatacg ccaactttga aaacaacttt gaaaaagctg 2160 

ttttctggta tttaaggttt tagaatgcaa ggaacagtga attggagttc gtcttgttat 2220 

aattagcttc ttggggtatc tttaaatact gtagaaaaga ggaaggaaat aataaatggc 2280 

taaaatgaga atatcaccgg aattgaaaaa actgatcgaa aaataccgct gcgtaaaaga 2340 

tacggaagga atgtctcctg ctaaggtata taagctggtg ggagaaaatg aaaacdtata 2400 

ttfcaaaaatg acggacagcc ggtatsaagg gaocacctat gafcg-fcgrgnaf! gggsaaagga 2460 

catgatgcta tggctggaag gaaagctgcc tgttccaaag gtcctgcact ttgaacggca 2520 

tgatggctgg agcaatctgc tcafcgagtga ggccgatggc gtcctttgct cggaagagta 2580 
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tgaagatgaa caaagccctg aaaagattat cgagctgtat gcggagtgca tcaggctctt 2640 

tcactccatc gacatatcgg attgtcccta tacgaatagc ttagacagcc gcttagccga 2700 

attggattac ttactgaata acgatctggc cgatgtggat tgcgaaaact gggaagaaga 2760 

cactccattt aaagafcccgc gcgagctgta tgatttttta aagacggaaa agcccgaaga 2820 

geraacttgtc ttttcccacg acgacctggg agacagcaac atctttgtga aagatggcaa 2880 

agtaagtggc tttattgatc ttgggagaag cggcagggcg gacaagtggt atgacattgc 2940 

cttctgcgtc cggtcgatca gggaggatat cggggaagaa cagtatgtcg agctattttt 3000 

tgacttactg gggatcaagc ctgafctggga gaaaataaaa tattatattt tactggatga 3 060 

attgttttag tacctagatg tggcgcaacg atgccggcga caagcaggag cgcaccgacfc 3120 

tcttccgcat caagtgtttt ggctctcagg ccgaggccca cggcaagtat tfcgggcaagg 3180 

ggtcgctggt attcgtgcag ggcaagattc ggaataccaa gtacgagaag gacggccaga 3240 

oggfcctaagg gacogacttc afcfcgccgaha aggf.ggatta tctggacacc aaggcaccag 3300 

gcgggtcaaa tcaggaataa gggcacattg ccccggcgtg agtcggggca atcccgcaag 3360 

gagggtgaat gaatcggaog tttgaccgga aggcatacag gcaagaactg atcgacgcgg 3420 

ggttttccgc cgaggatgcc gaaaccatcg caagccgcac cgtcatgcgt gcgccccgcg 3480 

aaaccttcca gtccgtcggc tcgatggtcc agcaagctac ggccaagatc gagcgcgaca 3540 

gcgtgcaact ggctccccct gccctgcccg cgccatcggc cgccgtggag cgttcgcgtc 3600 

gtctcgaaca ggaggcggca ggtttggcga agtcgatgac catcgacacg cgaggaacta 3660 

tgacgetccaa gaagcgaaaa aocgcoggcg aggaeafcggc aaaacaggtc agcgaggeea 3720 

agcaggccgc gttgctgaaa cacacgaagc agcagatcaa ggaaatgcag ctttccttgt 3780 

tcgatattgc gccgtggccg gacacgatgc gagcgatgcc aaacgacacg gcccgctctg 3840 
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ccctgttcac cacgcgcaac aagaaaafccc cgcgcgaggc gctgcaaaac aaggtcattt 3900 

tccacgtcaa caaggacgtg aagatcacct acaccggcgt cgagctgcgg gccgacgatg 3960 

acgaactggt gtggcagcag gtgttggagt acgcgaagcg cacccctatc ggcgagccg* 4020 

tcaccfctcac gttctacgag ctttgccagg acctgggctg gtcgatcaat ggccggtatt 4080 

acacgaaggc cgaggaatgc ctgtcgcgcc tacaggcgac ggcgatgggc ttcacgtccg 4140 

accgcgttgg gcacctggaa tcggtgtcgc tgctgcaccg cttccgcgtc ctggaccgtg 4200 

gcaagaaaac gtcccgttgc caggtcctga tcgacgagga aatcgtcgtg ctgtttgctg 4250 

gcgaccacta cacgaaattc atatgggaga agtaccgcaa gctgtcgccg acggcccgac 4320 

ggatgttcga ctatttcagc tcgcaccggg agccgtaccc gctcaagctg gaaaccttcc 4380 

gcctcatgtg cggatcggat tccacccgcg bgaagaagtg gcgcgagcag gtcggcgaag 4440 

cctgogaaga gttgcgaggc agcggcctgg tggaacacgc ctgggtcaat gatgacctgg 4500 

tgeattgca* acgctagggc cttatggggt cagttccggc tgggggttca gcagccagcg 4560 

ctttactggc atttcaggaa caagcgggca ctgctcgacg cacttgcttc gctcagtatc 4620 

gctcgggacg cacggcgcgc tctacgaact gccgataaac agaggattaa aattgacaat 4680 

tgtgattaag gcfccagattc gacggcttgg agcggccgac gtgcaggatt tccgcgagat 4740 

ccgattgtcg gccctgaaga aagctccaga gatgttcggg tccgtttacg agcacgagga 4800 

gaaaaagccc atggaggcgt tcgctgaacg gttgcgagat gccgtggcat tcggcgccta 4860 

catcgacggc gagatcattg ggctgtcggt cttcaaacag gaggacggcc ccaaggacgc 4920 

tcacaaggcg ca.fcctgtccg gcgtfcttegfc ggagaccgaa cagcgaggcc gaggggtcgc 4980 

aggtatgctg ctgcgggcgt tgccggcggg tttattgctc gtgatgatcg tccgacagat 5040 

tccaacggga atctggtgga tgcgcatctt catcctcggc gcacttaata tttcgctatt 5100 
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ctggagcttg ttgtttattt cggtctaccg cctgccgggc ggggtcgcgg cgacggtagg 5160 

cgctgtgcag ccgctgatgg tcgtgttcat ctctgccgct ctgctaggta gcccgatacg 5220 

attgatggcg gtcctggggg ctafcttgcgg aactgcgggc gtggcgctgt tggtgttgac 5280 

accaaacgca gcgctagatc ctgtcggcgt cgcagcgggc ctggcggggg cggtttccat 5340 

ggcgttcgga accgtgctga cccgcaagtg gcaacctccc gtgcctctgc tcacctttac 5400 

cgcctggcaa ctggcggccg gaggacttct gctcgttcca gtagctttag tgtttgatcc 5460 

gccaatcccg atgcctacag gaaccaatgt tctcggcctg gcgtggctcg gcctgatcgg 5520 

agcgggttta acctacttcc tttggttccg ggggatctcg cgactcgaac ctacagttgt 5580 

ttccttactg ggctttctca gccccagatc tggggtcgat cagccgggga tgcatcaggc 5640 

cgacagtcgg aacttcgggt ccccgacctg taccattcgg tgagcaatgg ataggggagt 5700 

tgatatcgfcc aacgttcact tctaaagaaa tagcgccact cagcttcctc agcggcttta 5760 

tccagcgatt tcctattatg tcggcatagt tctcaagatc gacagcctgt cacggttaag 5820 

cgagaaatga ataagaaggc tgataattcg gatctctgcg agggagatga tatttgatca 5880 

caggcagcaa cgctctgtca tcgttacaat caacatgcta ccctccgcga gateaLcegt 5940 

gtttcaaacc cggcagctta gttgccgttc ttccgaatag catcggtaac atgagcaaag 6000 

tctgccgcct tacaacggct cfccccgctga cgccgtcccg gactgatggg ctgcctgtat 6060 

cgagtggtga ttttgtgccg agctgccggt cggggagctg ttggctggct ggtggcagga 6120 

tatattgtgg tgfcaaacaaa ttgacgctta gacaacttaa taacacattg cggacgtttt 6180 

taatgtactg gggtggtttt tcttttcacc agtgagacgg gcaacagctg attgcccttc 6240 

accgcctggc cctgagagag ttgcagcaag cggtccacgc hggtttgccc cagcaggcga 6300 

aaatcotgtt tgatggtggt fcccgaaatcg gcaaaatccc ttataaatca aaagaatagc 63 60 
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ccgagatagg gttgagtgtt gttccagttt ggaacaagag tccactatta aagaacgtgg 6420 

actccaacgt caaagggcga aaaaccgtct afccagggcga tggcccacta cgtgaaccat 6480 

cacccaaatc aagttttttg gggtcgaggt gccgtaaagc actaaatcgg aaccctaaag 6540 

ggagcccccg atttagagct tgacggggaa agccggcgaa cgtggcgaga aaggaaggga 6600 

agaaagcgaa aggagcgggc gccattcagg ctgcgcaact gttgggaagg gcgatcggtg 6660 

cgggcctctt cgctattacg ccagctggcg aaagggggat gtgctgcaag gcgattaagt 6720 

tgggtaacgc cagggttttc ucagtoacga cgttgtaaaa ogaoggooag fcgaattcgsg 67R0 

ctcggtaccc ggggatcttt cgacactgaa atacgtcgag cctgctccgc ttggaagcgg 6840 

cgaggagcct cgtcctgtca caactaccaa catggagtac gataagggcc agttccgcca 6900 

gctcattaag agccagttca tgggogttgg catgatggcc gtcafcgcatc tgtacttcaa 6960 

gfcacaccaac gctcttctga tecagtcgat catccgctga aggcgctttc gaatctggtt 7020 

aagatccacg tcttcgggaa gccagcgact ggtgacctcc agcgtccctt taaggctgcc 7080 

aacagctttc tcagccaggg ccagcccaag accgacaagg cctccctcca gaacgccgag 7140 

aagaactgga ggggtggtgt caaggaggag taagctcctt attga&gtcg gaggacggag 7200 

cggtgtcaag aggatattct tcgactctgt attatagata agatgatgag gaattggagg 7260 

tagcatagct tcatttggat ttgctttcca ggctgagact ctagcttgga gcatagaggg 7320 

tcctttggct ttcaatattc tcaagtatct cgagtttgaa cttattccct gtgaaccttt 7380 

tattcaccaa tgagcattgg aatgaacatg aatctgagga ctgcaatcgc catgaggttt 7440 

tcgaaataca tccggatgtc gaaggcttgg ggcacctgcg ttggttgaat ttagaacgtg 7500 

gcactattga tcatccgata gctctgcaaa gggcgttgca caatgcaagt caaacgttgc 7560 
tagcagttcc aggtggaatg ttatgatgag cattgtatta aatcaggaga tatagcatga 7 620 
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tctctagtta gctcaccaca aaagtcagac ggcgtaacca aaagtcacac aacacaagct 7680 

gtaaggattt cggcacggct acggaagacg gagaagccac cbtcagtgga ctcgagtacc 7740 

atttaattct atttgtgttt gatcgagacc taatacagcc cctacaacga ccatcaaagt 7800 

cgtahagcta ccagtgagga agtggactca aatcgacttc agcaacatct cctggataaa 7860 

ctttaagcct aaactataca gaataagata ggtggagagc ttataccgag ctcccaaatc 7920 

tgtccagatc atggttgacc ggtgcctgga tcttcctata gaatcatcct tafctcgttga 7980 

cctagctgat tctggagtga cccagagggt catgcujttga gcctdaaatc cgccgcctcc 8040 

accatttgta gaaaaatgtg acgaactcgt gagctctgta cagtgaccgg tgactctttc 8100 

tggcatgcgg agagacggac ggacgcagag agaagggctg agtaataagc cactggccag 8160 

acagctctgg cggctctgag gtgcagtgga tgattatfcaa tccgggaccg gccgcccctc 8220 

cgccccgaag tggaaaggct ggtgtgcccc tcgttgacca agaatctatt gcatcatcgg 8280 

agaatafcgga gcttcatcga atcaccggca gtaagcgaag gagaatgtga agccaggggt 8340 

gtatagccgt cggcgaaata gcatgccatt aacctaggta cagaagtcca attgcttccg 8400 

atctggtaaa agattcacga gatagtacct tctccgaagt aggtagagcg agtacccggc 8460 

gcgtaagctc cctaattggc ccatccggca tctgtagggc gtccaaatat cgtgcctctc 8520 

ctgctttgcc cggtgtatga aaccggaaag gccgctcagg agctggccag cggcgcagac 8580 

cgggaacaca agctggcagt cgacccatcc ggtgctctgc actcgacctg ctgaggtccc 8640 

tcagtccctg gfcaggcagct ttgccccgtc tgtccgcccg gtgtgtcggc ggggttgaca 8700 

aggtcgttgc gtcagtccaa catttgttgc catattttcc tgctctcccc accagctgct 8760 

cttttetttt ctctttcttt tcccatctta agtatattca tcttcccatc caagaacctt 8820 

tatttcccct aagtaagtac tttgctacat ccatactcca tccttcccat cccttattcc 8880 
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tttgaacctt tcagttcgag ctttcccact tcatcgcagc ttgactaaca gctaccccgc 8940 

ttgagcagac atcaccatgc ctgaactcac cgcgacgtct gtcgagaagt ttctgatcga 9000 

aaagttcgac agcgtctccg acctgatgca gctctcggag ggcgaagaafc ctcgtgcttt 9060 

cagcttcgat gtaggagggc gtggatatgt cctgcgggta aatagctgcg ccgatggttt 9120 

ctacaaagat cgttatgttt atcggcactt tgcatcggcc gcgctcccga ttccggaagt 9180 

gcfctgacatt ggggaattca gcgagagcct gacctattgc atcfccccgcc gtgcacaggg 9240 

tgtcacgttg caagacctgc ctgcicaat;cya actycccyet gttctycayc cggtcgcgga 9300 

ggccatggat gcgatcgctg cggccgatct tagccagacg agcgggttcg gcccattcgg 9360 

accgcaagga atcggtcaat acactacatg gcgtgatttc atatgcgcga fctgctgatcc 9420 

ccatgtgtat cactggcaaa ctgtgatgga cgacaccgtc agtgcgtccg tcgcgcaggc 9480 

tctogatgsg otgatgcttt ggaccgagga ctgccccgaa gtccggcacc tcgtgcacgc 9540 

ggatttcggc tccaacaatg tcctgacgga caatggccgc ataacagcgg tcattgactg 9600 

gagcgaggcg atgttcgggg attcccaata cgaggtcgcc aacatcttct tcfcggaggcc 9660 

gtggttggct tgtatggagc agcagacgcg ctacttcgag cggaggcatc cggagcttgc 9720 

aggatcgccg cggctccggg cgtatatgct ccgcattggt cttgaccaac tctatcagag 9780 

cttggttgac ggcaatttcg atgatgcagc ttgggcgcag ggtcgatgcg acgcaatcgt 9840 

ccgatccgga gccgggactg tcgggcgtac acaaatcgcc cgcagaagcg cggccgtctg 9900 

gaccgafcggc fcgtgfca.ga.ag- taotogocga tagtggaaac cgacgcoeca gcactegtcc 9960 

gagggcaaag gaatagagta gatgccgacc gcgggatcga tccactfcaac gttactgaaa 10020 

tcatcaaaca gcttgacgaa tctggatata agatcgttgg tgtcgatgtc agctccggag 10080 



WO 2004/063358 PCT/EP2004/000100 
133/358 

ttgagacaaa tggtgttcag gatctcgata agatacgttc atttgtccaa gcagcaaaga 10140 

gtgccttcta gtgatttaat agctccatgfc caacaagaat aaaacgcgtt ttcgggttta 10200 

cctcttccag atacagctca tctgcaatgc attaatgcat tgactgcaac ctagtaacgc 10260 

cttncaggct ccggcgaaga gaagaatagc ttagcagagc tattttcatt ttcgggagac 10320 

gagatcaagc agatcaacgg tcgtcaagag acctacgaga ctgaggaatc cgctcttggc 10380 

tccacgcgac tatatatttg tctctaattg tactttgaca tgctcctctt ctttactctg 10440 

atagcttgac tatgaaaatt ccgtcaccag cncctgggtt cgcaaagata attgcatgtt 10500 

tcttccttga actctcaagc ctacaggaca cacattcatc gtaggtataa acctcgaaat 10560 

canttcctac taagatggta tacaatagta accatgcatg gttgcctagt gaatgctccg 10620 

taacacocaa tacgccggcc gaaacttttt tacaactctc ctatgagtcg tttacccaga 10680 

atgcacaggt acacttgttt agaggtaatc cttctttcta gotagaagtc ctcgtgtact 10740 

gt.ghsragcgc ccactccaca tctccactcg acctgcaggc atgcaagctt agagataaaa 10800 

taaaaagaga agaaaagaaa gtttgtacaa tttcfcttttg tttatataac atacacgcta 10860 

tgtcaacatt tagaataagg gggaaaaaat cttccatcat attcgaatgc acaagattat 10920 

ttctttgttc gctctttttg gtcgggtcat cgagatttag agtgtaatca aagatactgt 10980 

catctcgaga gcgttgcaca ggctgctgtt tgccaaattg gatgtttgcc gaattagtaa 11040 

aatacgcaag catttcttac ctttccgctc ccttttccta attctcccaa agactaaatg 11100 

aggaaagata aaggacaaag aaaatgtaaa gacaaagaaa ttgaaaacga tataaacttg 11160 

ca^cacgtaa gaocaaagea asfctg-gtaan tafcfcefcfcgtg tacaaacatg tataaaaaaa 11220 

aacttttttt tgctccfcgga ggacaaaatt tcaaactcct tgaagaagat tgcttgtata 11280 

tctatcatat gcatatatca tatcgatgga aaaagaaagt caggcatgta tttataaaaa 11340 
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gaagaatgtg ccatgcttcc gaatttcttt tcactttctt ttccttatct attttaatct 11400 
catgctgtcg aagctgcagt caatcagcgt caaggcccgc cgcgttgaac tagcccgcga 11460 
catcacgcgg cccaaagtct gcctgcatgc tcagcggtgc tcgttagttc ggctgcgagt 11520 
ggcagcacca cagacagagg aggcgctggg aaccgtgcag gctgccggcg cgggcgatga 11580 
gcacagcgcc gafcgtagcac tccagcagct tgaccgggct atcgcagagc gtcgtgcccg 11640 
gcgcaaacgg gagcagctgt cataccaggc tgccgccatt gcagcatcaa ttggcgtgtc 11700 
aggcattgcc atcttcgcca cctacctgag atttgccatg cacatgaccg tgggcggcgc 11760 
agtgccatgg ggtgaagtgg ctggcactct cctcttggtg gttggtggcg cgctcggcat 11820 
ggagatgtat gcccgctatg cacacaaagc catctggcat gagtcgcctc fcgggctggct 11880 
gctgcacaag agccaccaca cacctcgcac tggacccttt gaagccaacg acttgtttgc 11940 
aatcatcaat ggactgcccg ccatgctcct gtgtaccttt ggcttctggc tgcccaacgt 12000 
ccir.gggggng gcctgctttg gagcggggct gggcatcacg ctatacggca tggcatatat 12060 
gtttgtacac gatggcctgg tgcacaggcg ctttcccacc gggcccatcg ctggcctgcc 12120 
□tacatgaag cgcctgacag tggcccacca gctacaccac agcggcaagt acggtggcgc 12180 
gccctggggt atgttcttgg gtccacagga gctgcagcac attccaggtg cggcggagga 12240 
ggtggagcga ctggtcctgg aactggactg gtccaagcgg tagaagcttg gcgtaatcat 12300 
ggtcatagct gtttcctgtg tgaaattgtt atccgctcac aattccacac aacafcacgag 12360 
ccggaagcat aaagtgtaaa gcctggggtg cctaatgagt gagctaactc acattaattg 12420 
cgttgcgcta aotgaoogot ttccsgtcgg gaaaectgtc gtgccagctg cattaatgaa 12480 
tcggccaacg cgcggggaga ggcggtttgc gtattgggcc aaagacaaaa gggcgacatt 12540 
caaccgattg agggagggaa ggtaaatatt gacggaaatt attcattaaa ggtgaattafc 12600 
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caccgtcacc gacttgagcc atttgggaat tagagccagc aaaatcacca gtagcaccat 12660 

taccattagc aaggccggaa acgtcaccaa tgaaaccatc gatagcagca ccgtaatcag 12720 

tagcgacaga atcaagtttg ccfcttagcgt cagactgfcag cgcgttttca tcggcatttt 12780 

cggtcatagc ccccttatta gcgtttgcca tcttttcata afccaaaabca ccggaaccag 12840 

acrccaccacc ggaaccgcct ccctcagagc cgccaccctc agaaccgcca ccctcagagc 12900 

caccaccctc agagccgcca ccagaaccac caccagagcc gccgccagca ttgacaggag 12960 

gcccgatcta gtaacataga tgacaccgcg cgcgataatt tatcctagtt tgcgcgctat 13020 

attttgtttt ctabcgcgta ttaaatgtat aattgcggga ctctaatcat aaaaacccat 13080 

ctcataaata acgtcatgca ttacatgtta attattacat gcttaacgta attcaacaga 13140 

aattatatga taatcatcgc aagaccggca acaggattca atcttaagaa actttattgc 13200 

caaatgtttg aacgatcggg gatcatccgg gtctgtggcg ggaactccac gaaaatatcc 13260 

gaaogcagca agat-.atcgcg gtgcatctcg gtcttgcctg ggcagtcgcc gccgacgccg 13320 

ttgatgtgga cgccgggccc gatcatattg tcgctcagga tcgtggcgtt gtgcttgtcg 13380 

gccgttgctg tcgtaatgat atcggcacct tcgaccgcct gttccgcaga gatuccgtgg 13440 

gcgaagaact ccagcatgag atccccgcgc tggaggatca tccagccggc gtcccggaaa 135 00 

acgattccga agcccaacct ttcatagaag gcggcggtgg aatcgaaatc tcgtgatggc 13560 
aggttgggcg tcgcttggtc ggtcatttcg aaccccagag tcccgctcag aagaactcgt 13620 
caagaaggcg atagaaggcg atgcgctgcg aatcgggagc ggcgataccg taaagcacga 13680 
ggaagcggtc agcccattcg ccgccaagct cttcagcaat atcacgggta gccaacgcta 13740 
tgtcctgafca gcggtccgcc acacccagcc ggccacagtc gatgaatcca gaaaagcggc 13800 
cattttccac catgatattc ggcaagcagg catcgccatg ggtcacgacg agatcatcgc 13860 
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cgtcgggcat gcgcgccttg agcctggcga acagttcggc tggcgcgagc ccctgatgct 13920 

cttcgtccag atcatcctga tcgacaagac cggcttccat ccgagtacgt gctcgctcga 13980 

tgcgatgttt cgcttggtgg tcgaatgggc aggtagccgg atcaagcgta tgcagccgcc 14040 

gcattgcatc agccatgatg gatactttct cggcaggagc aaggtgagat gacaggagat 14100 

cctgccccgg cacttcgccc aatagcagcc agtcccttcc cgcttcagtg acaacgtcga 14160 

gcacagctgc gcaaggaacg cccgtcgtgg ccagccacga tagccgcgct gcctcgtcct 14220 

gcagttcatt cagggcaccg getuetggt.cgg tcttcfacaao. aagaaccggg cgccoctgcg 14280 

ctgacagccg gaacacggcg gcatcagagc agccgattgt ctgttgtgcc cagtcatagc 14340 

cgaatagcct ctccacccaa gcggccggag aacctgcgtg caatccatct tgttcaatca 14400 

tgcgaaacga tccagatccg gtgcagatta tttggattga gagtgaatat gagactctaa 14460 

ttggataccg aggggaattt atggaacgtc agtggageat ttttgacaag aaatatttgc 14520 

tagctgatag tgaccttagg cgacttttga acgcgcaata atggtttctg acgtatgtgc 14580 

ttagctcatt aaactccaga aacccgcggc tgagtggctc cttcaacgtt gcggttctgt 14640 

cagttccaaa cgtaaaacgg cttgtcccgc gtcatcggcg ggggtcataa cgtgactccc 14700 

ttaattctcc gctcatgatc agattgfccgt ttcccgcctt cagtttaaac tatcagtgtt 14760 

tgacaggata tattggcggg taaacctaag agaaaagagc gtttattaga ataatcggat 14820 

atttaaaagg gcgtgaaaag gtttatccgt tcgtccattt gtatgtgcat gccaaccaca 14880 

gggttcccca gatctggcgc cggccagcga gacgagcaag attggccgcc gcccgaaacg 14940 

atccgacagc gcgcccagca caggtgcgca ggcaaattgc accaacgcat acagcgccag 15000 
cagaatgcca tagtgggcgg tgacgtcgtt cgagtgaacc agatcgcgca ggaggcccgg 15060 
cagcaccggc ataatcaggc cgatgccgac agcgtcgagc gcgacagtgc tcagaattac 15120 
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gatcaggggt atgttgggtt tcacgtctgg actccggacc agcctccgct ggtccgattg 15180 

aacgcgcgga ttctttatca ctgafcaagtt ggtggacata ttatgtttat cagtgafcaaa 15240 

gtgtcaagca tgacaaagtt gcagccgaat acagtgatcc gtgccgccct ggacctgttg 15300 

aacgaggtcg gcgtagacgg tctgacgaaa egcaaactgg cggaacggtt gggggtfccag 15360 

cagccggcgc tttactggca cttcaggaac aagcgggcgc tgctcgacgc actggccgaa 15420 

gccatgctgg cggagaafcca tacgcattcg gtgccgagag ccgacgacga ctggcgctca 15480 

tttctgatcg ggaatgcccg cagcttcagg caggcgctgc tcgoctaocg ogatggcgog 15540 

cgcatccatg ccggcacgcg accgggcgca c.cgcagatgg aaacggccga ogcgcagctt 15600 

cgcttcctct gcgaggcggg tttttcggcc ggggacgccg tcaatgcgct gatgacaatc 15660 

agctacttca ctgttggggc cgtgcttgag gagcaggccg gcgacagcga tgccggcgag 15720 

cgcggcggca ccgttgaaca ggcfcccgctc tcgccgctgt tgcgggccgc gatagacgcc 15780 

ttcgacgaag ccggtccgga cgcagcgttc gagcagggac tcgcggtgat tgtcgatgga 15840 

ttggcgaaaa ggaggctcgt tgtcaggaac gttgaaggac cgagaaaggg tgacgattga 15900 

tcaggaccgc tgccggagcg caacccactc actacaguag aguuatgLctg acaacatocc 159G0 

ctcccccttt ccaccgcgtc agacgcccgt agcagcccgc tacgggcttt ttcatgccct 16020 

gccctagcgt ccaagcctca cggccgcgct cggcctctct ggcggccttc tggcgctctt 16080 

ccgcttcctc gctcactgac tcgctgcgct cggtcgttcg gctgcggcga gcggtatcag 16140 

ctcactcaaa ggcggtaata cggttatcca cagaatcagg ggataacgca ggaaagaaca 16200 

tgtgagcaaa aggccagcaa aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt 16260 

hccataggct ccgcccccct gacgagcatc acaaaaatcg acgctcaagt cagaggtggc 16320 

gaaacccgac aggactataa agataccagg cgtttccccc tggaagctcc ctcgtgcgct 16380 
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cfccctgttcc gaccctgccg cttaccggat acctgtccgc ctttctccct tcgggaagcg 16440 

tggcgctttt ccgctgcata accctgcttc ggggtcatta tagcgatttt ttcggtatat 16500 

ccatcctttt tcgcacgata tacaggattt tgccaaaggg ttcgtgtaga ctttccttgg 16560 

tgtafcccaac ggcgtcagcc gggcaggata ggtgaagtag gcccacccgc gagcgggtgt 16620 

tccttcttca ctgtccctta ttcgcacctg gcggtgctca acgggaatcc tgctctgcga 16680 

ggctggccgg ctaccgccgg cgtaacagat gagggcaagc ggatggctga tgaaaccaag 16740 

ccaaccagga agggcagccc acctatcaag gtgtactgcc ttccagacga acgaagagcg 16800 

attgaggaaa aggcggcggc ggccggcatg agcctgtcgg cctacctgct ggccgtcggc 16860 

cagggctaca aaatcacggg cgtcgtggac tatgagcacg tccgcgagct ggcccgcatc 16920 

aatggcgacc tgggccgcct gggcggcctg ctgaaactct ggctcaccga cgacccgcgc 16980 

acggcgcggt tcggtgatgc cacgatcctc gccctgctgg cgaagatcga agagaagoag 17040 

gacgagcttg gcaaggtcat gatgggcgtg gtccgcccga gggcagagcc atgacttttt 17100 

tagccgctaa aacggccggg gggtgcgcgt gattgccaag cacgtcccca tgcgctccat 17160 

caagaagagc gacttcgcgg agctggtgaa gtacatcacc gacgagcaag gcaagaccga 17220 

gcgcctttgc gacgctca 17238 

<210> 40 
<211> 18449 
<212> DKA 
<213> Artificial 

<220> 

<223> Plasmid 
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<220> 

<221> m±sc_feafctxre 

<222> (3471) .. (3471) 

<223> n is a, c, g, or t 

<220> 

<221> misc_£eature 

<222> (3679) .. (3679) 

<223> n is a, c, g, or t 

<220> 

<221> misc_feature 

<222> (3770) (3770) 

<223> n is a, c, g, or fc 

<400> 40 

gatctttcga cactgaaata cgtcgagcct gctccgcttg gaagcggcga ggagcctcgt 60 

cctgtcacaa ctaccaacat ggagtacgat aagggccagt tccgccagct cattaagagc 120 

cagttcafcgg gcgttggcat gatggccgtc afcgcatctgt aottcaagta caccaacgct 180 

cttctgatcc agtcgatcat ccgctgaagg cgctttcgaa tctggttaag atccacgtct 240 

tcgggaagcc agcgactggt gacctccagc gtccctttaa ggctgccaac agctttctca 300 

gccagggcca gcccaagacc gacaaggcct ccctccagaa cgccgagaag aactggaggg 360 

gtggtgtcaa ggaggagtaa gctccttatt gaagtcggag gacggagcgg tgtcaagagg 420 

atattcttcg actctgtatt atagataaga tgatgaggaa ttggaggtag catagchtca 480 

■ tttggatttg' ctttccaggc tgagactcta gcttggagca tagagggtcc tttggctttc 540 

aatattctca agtatctcga gtttgaactt attccctgtg aaccttttat tcaccaatga 600 

geat-.tggaBf: gaaeatgaat rttgaggactg caatcgccat gaggttttcg aaatacatcc 660 

ggatgtcgaa ggcttggggc acctgcgttg gttgaattta gaacgtggca ctattgatca 720 

tccgatagct ctgcaaaggg cgttgcacaa tgcaagtcaa acgttgctag cagttccagg 780 
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tggaatgtta tgatgagcat tgtattaaat caggagatat agcatgatct otagttagct 840 

caccacaaaa gtcagacggc gtaaccaaaa gtcacacaac acaagctgta aggatttcgg 900 

cacggctacg gaagacggag aagccacctt cagtggacfcc gagtaccatt taattctatt 96 u 

tgtgtttgat cgagacctaa tacagaccct acaacgacca tcaaagtcgt atagctacca 1020 

gtaaagwgt ggactcaaat cgacttcagc aacatctcct ggataaactt taagcctaaa 1080 

ctatacagaa taagataggt ggagagctta taccgagctc ccaaatctgt ccagatcatg 1140 

gttgaccggt gcctggatct tcctatagaa tcatccttat tcgttgacct agctgattct 1200 

ggagtgaccc agagggtcat gacttgagcc taaaatccgc cgcctccacc atttgtagaa 1260 

aaatgtgacg aactcgtgag ctctgtacag tgaccggtga ctctttctgg catgcggaga 1320 

gacggacgga cgcagagaga agggctgagt aataagccac tggccagaca gctctggogg 1380 

ctctgaggtg cagtggatga ttattaatcc gggaccggcc gcccctccgc cccgaagtgg 1440 

aaaggotggfc gtgoccctcg ttga.oe.aaga atcfcattgca tcatcggaaa atatggagcfc 1500 

tcatcgaatc accggcagta agcgaaggag aatgtgaagc caggggtgta tagccgtcgg 1560 

cgaaatagca tgccattaac ctaggtacag aagtccaatt gcttccgatc tggtaaaaga 1620 

ttcacgagat agtaccttct ccgaagtagg tagagcgagt acccggcgcg taagctccct 1680 

aattggccca tccggcatct gtagggcgtc caaatatcgt gcctctcctg ctttgcccgg 1740 

tgtatgaaac cggaaaggcc gctcaggagc tggccagcgg cgcagaccgg gaacacaagc 1800 

tggcagtcga cccatccggt gctctgcact cgacctgctg aggtccctca gtccctggta 1860 

gguagctttg ccccgtctgt ccgccoggtg fcgtcggcggg gfctgacaagg tr-gttgegfcc 1920 

agtccaacat tfcgttgccat attttcctgc tctccccacc agatgctctt ttcttttctc 1980 

tttcttttcc catcttcagt atattcatct tcccafcccaa gaacctttat ttcccctaag 2040 
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taagtacttt gctacatcca tactccatcc ttcccatccc ttattccttt gaacctttca 2100 

gttcgagctt tcccacttca tcgcagcttg actaacagct accccgcttg agcagacatc 2160 

accatgcctg aactcaccgc gacgtctgtc gagaagtttc tgatcgaaaa gttcgacagc 2220 

gtctccgacc tgatgcagct ctcggagggc gaagaatctc gtgctttcag cttcgatgta 2280 

ggagggcgtg gatatgtcct gcgggtaaat agctgcgccg atggtttcta caaagatcgt 2340 

tatgtttatc ggcactttgc atcggccgcg ctcccgattc cggaagtgct tgacattggg 2400 

gaattuagcg agagoctgac ctafctgcafcc tcccgacgtg cacagggfcgt cacgttgcaa 2460 

gacctgcctg aaaccgaact gcccgctgtt ctgcagccgg tcgcggaggc catggatgcg 2520 

atcgctgcgg ccgatcttag ccagacgagc gggttcggcc cattcggacc gcaaggaatc 2580 

ggtcaataca ctacatggcg tgatttcata fcgcgcgattg ctgatcccca tgfcgtatcac 2640 

tggcaaactg tgatggacga caccgtcagt gcgtccgtcg cgcaggctct cgatgagctg 2700 

atgctttggg ccgaggactg ccccgaagtc cggcacctcg tgcacgcgga tttcggctcc 2760 

aacaatgtcc tgacggacaa tggccgcata acagcggtca ttgactggag cgaggcgatg . 2820 

ttcggggatt cccaatacga ggtcgccaac: aLcLLcttct ggaggccgtg gttggcttgfc 2880 

afcggagcagc agacgcgcta cttcgagcgg aggcatccgg agcttgcagg atcgccgcgg 2940 

ctccgggcgt atatgctccg cattggtctt gaccaactct atcagagctt ggttgacggc 3000 

aatttcgatg atgcagcttg ggcgcagggt cgatgcgacg caatcgtccg atccggagcc 3060 

gggactgtcg ggcgtacaca aatcgcccgc agaagcgcgg ccgtctggac cgatggctgt 3120 

gtagaagtac tcgccgatag tggaaaccga cgccccagca ctcgtccgag ggcaaaggaa 3180 

tagagtagat gccgaccgcg ggatcgatcc acttaacgtt actgaaatca tcaaacagct 3240 

tgacgaatct ggatataaga tcgttggtgt cgatgtcagc tccggagttg agacaaatgg 33 00 
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tgttcaggat ctcgataaga tacgttcatt tgtccaagca gcaaagagtg ccttctagtg 3360 

atttaatagc tccatgtcaa caagaataaa acgcgttttc gggtttacct cttccagata 3420 

cagctcatct gcaatgcatt aatgcattga ctgcaaccta gtaacgcctt rxcaggctccg 3480 

gcgaagagaa gaatagctta gcagagctat tttcattttc gggagacgag atcaagcaga 3540 

tcaacggtcg tcaagagacc tacgagactg aggaatccgc tcttggctcc acgcgactat 3600 

atatttgtct ctaattgtac tttgacatgc tcctcttctt tactctgata gcttgactafc 3660 

gaaaattccg tcaccagcnc ntgggthngc aaagataatt gre*-Htgfctfcet tercttgaaet 3720 

ctcaagccta caggacacac attcatcgta ggtataaacc tcgaaatcan ttcctactaa 3780 

gatggtatac aatagtaacc atgcatggtt gcctagtgaa tgctccgtaa cacccaatac 3840 

gccggccgaa acttttttac aactctccta tgagtcgttfc acccagaatg cacaggtaca 3900 

cttgfcttaga ggtaatcctt ctttctagct agaagtccfcc gtgtactgtg taagcgccca 3960 

ctccacatct ccactcgacc tgcaggcatg caaagcttga gattaaaata gataaggaaa 4020 

agaaagtgaa aagaaattcg gaagcatggc acattcttct ttttataaat acatgcctga 4080 

ctttcttttt cca.tcga.tat gatatatgca tatgatagat atacaagcaa tcttcttcaa 4140 

ggagtttgaa attttgfccct ccaggagcaa aaaaaagttt tttttfcatac atgtttgtac 4200 

acaagaatag ttaccaattt gctttggtct tacgtgctgc aagtttatat cgttttcaat 4260 

ttctttgtct ttacattttc tttgtccttt atctttcctc atttagtctt tgggagaatt 4320 

aggaaaaggg agcggaaagg taagaaatgc ttgcgtattt tactaattcg gcaaacatcc 4380 

aatttggcaa acagcagcct gtgcaacgct ctcgagatga cagtatcttt gattacactc 4440 

taaatctcga tgacccgacc aaaaagagcg aacaaagaaa taatcttgtg cattcgaata 4500 

Lgatggaaga ttttttcccc cttattctaa atgttgaeat agcgtgtatg ttatataaac 4560 
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aaaaagaaat tgtacaaact ttcttttctt ctctttttat tttatctcta tgctgtcgaa 4620 

gctgcagtca atcagcgtca aggcccgccg cgttgaacta gcccgcgaca tcacgcggcc 4680 

caaagtctgc ctgcatgctc agcggtgctc gttagttcgg ctgcgagtgg cagcaccaca 4740 

gacagaggag gcgctgggaa ccgtgcaggc tgccggcgcg ggcgatgagc acagcgccga 4800 

tgtagcactc cagcagcttg accgggctat cgcagagcgt cgtgcccggc gcaaacggga 4860 

gcagctgtca taccaggctg ccgccattgc agcatcaatt ggcgtgtcag gcathgccat 4920 

attcgcoaoa tacctg&gsfe ttgccatgna nafcgaccotg ggcgcrcgcag tgccatgggg 4980 

tgaagtggct ggcactctcc tcttggtggt tggtggcgcg ctcggcatgg agatgtatgc 5040 

ccgctafcgca cacaaagcca tctggcatga gtcgcctctg ggctggctgc tgcacaagag 5100 

ccaccacaca cctcgcactg gaccctttga agccaacgac ttgtttgcaa tcatcaatgg 5160 

actgcccgcc atgctcctgt gtacctttgg cttctggctg cccaacgtcc tgggggcggc 5220 

ctgctttgga gcggggctgg gcatcacgct atacggcatg gcatatatgt ttgtacacga 5280 

tggcctggtg cacaggcgct ttcccaccgg gcccatcgct ggcctgccct acatgaagcg 5340 
cctgacagtg gcccaccagc tacaooaoag cggcaagtao ggfcgg-egagr! nctggggtat 5400 
gttcttgggt ccacaggagc tgcagcacat tccaggtgcg gcggaggagg tggagcgact 5460 
ggtcctggaa ctggactggt ccaagcggta gattgtgact gatagcgaga ctctgggtcg 5520 
atgttafcctg ccfccaacaat ggcttagaaa agaagaaaca gaacaaatac agcaaggcaa 5580 
cgcccgtagc ctaggtgatc aaagactgtt gggcttgtct ctgaagcttg taggaaaggc 5640 
agacgctatc atggtgagag ctaagaaggg cattgacaag ttgccggcaa actgtcaagg 5700 
cggtgtacga gctgcttgcc aagtatatgc tgcaattgga tctgtactca agcagcagaa 5760 
gacaacatat cctacaagag ytcatctaaa aggaag-cgaa cgtgocaaga ttgctctgfct 5820 
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1 

gagtgtatac aacctctatc aatctgaaga 

gattaagagt ttttttgttg atteigtgaat 
aaagagacaa cacatacaat ataaaatcat 
aagcctgcat tttttttgta cgcataaaca 
aattatgtca aactagggaa aattcttttfc 
ggagtcacag gcttgtcttc agattgatag 
gcacgttcgc ttccttttag atgagctctt 
acagatccaa ttgcagcata tacttggcaa 
ggcaacttgt caatgccctt cttagctctc 
ttcagagaca agcccaacag tctttgatca 
tgttctgttt cttcttttct aagccattgt 
gagccatact acagcataaa aggatacgtt 
cagcacatac aaaaaaaaag aaatttaaga 
tattcaatcc ataaatgaat tatttttgga 
tatttttttt ttttttacaa ctccaccaat 
tcatagctgt ttcctgtgtg aaattgttat 
ggaagcataa agtgtaaagc otggggtgcc 
ttgcgctcac tgcccgcttt ccagtcggga 
ggccaacgcg cggggagagg cggtttgcgt 
accgattgag ggagggaagg taaatattga 
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caagcctgtg gctctccgtc aagctagaaa 5880 

fct.ttgttt.ts. tttatytctg afcagttc«±a.t 5940 

tgtctttaaa tgttaafctta gtagagtgta 6000 

atgaattcac cccgcttctg gtttttaaat 6060 

tttctcttcg fctctthtttt ggcttgttgt 6120 

aggttgtata cactcaacag agcaatcttg 6180 

gtaggatatg ttgtcttctg ctgcttgagt 6240 

gcagctcgta caccgccttg acagtttgcc 6300 

accatgatag cgtetgcctt tcctacaagc 6360 

cctaggctac gggcgttgcc ttgctgtatt 6420 

tgaggcagat aacatcgacc caacafccctc 6480 

ttctttaaca gaaatttacc cttttgttat 6540 

tgagtaggac ttccattctc tcaaaaattt 6600 

caaaaaagaa agattatgcc tgattttctc 6660 

actttctagc ccagcttggc gtaatcatgg 6720 

ccgctcacaa ttccacacaa catacgagcc 6780 

fcaatgagtga gctaactcac attaattgcg 6840 

aacctgtcgt gccagctgca ttaatgaatc 6900 

attgggccaa agacaaaagg gcgacattca 6960 

cggaaattat tcattaaagg tgaattatca 7020 
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ccgtcaccga cttgagccat ttgggaatta gagccagcaa aatcaccagt agcaccatta 7080 

ccattagcaa ggccggaaac gtcaccaatg aaaccatcga tagcagcacc gtaatcagfca 7140 

gcgacagaat caagtttgcc tttagcgtca gactgtagcg cgttttcatc cfgcstfcttcg 7200 

gtcatagccc ccttattagc gtttgccatc ttttcataat caaaatcacc ggaaccagag 7260 

ccaccaccgg aaccgcctcc ctcagagccg ccaccctcag aaccgccacc ctcagagcca 7320 

ccaccctcag agccgccacc agaaccacca ccagagccgc cgccagcatt gacaggaggc 7380 

ccgatctagt aacatagatg acaccgcgcg cgataattfca tcctagfcttg cgcgctatat 7440 

tttgttttct atcgcgtatt aaatgtataa ttgcgggact ctaatcataa aaacccatct 7500 

cataaataac gtcatgcatt acatgttaat tattacatgc ttaacgtaat tcaacagaaa 7560 

ttatatgata atcatcgcaa gaccggcaac aggattcaat cttaagaaac tttattgcca 7620 

aatgtttgaa cgatcgggga tcatccgggt ctgtggcggg aactccacga aaatatccga 7680 

acgcagcaag atatcgcggt gcatctcggt cttgcctggg cagtcgccgc cgacgccgfct 7740 

gatgtggacg ccgggcccga tcatattgtc gctcaggatc gtggcgttgt gcttgtcggc 7800 

cgttgctgtc gtaatgatat cggcaccttc gaccgcctgt tccgcagaga tcccgtgggc 7860 

gaagaactcc agcatgagat ccccgcgctg gaggatcatc cagccggcgfc cccggaaaac 7920 

gattccgaag cccaaccttt catagaaggc ggcggtggaa tcgaaatctc gtgatggcag 7980 

gttgggcgtc gcttggtcgg tcatttcgaa ccccagagtc ccgctcagaa gaactcgtca 8040 

agaaggcgat agaaggcgat gcgctgcgaa tcgggagcgg cgataccgta aagcacgagg 8100 

aagcggtcag cccattcgcc gccaagctct tcagcaatat cacgggtagc caacgctatg 8160 

tcctgatagc ggtccgccac acccagccgg ccacagtcga fcgaatccaga aaagcggcca 8220 

ttttccacca tgatattcgg caagcaggca tcgccatggg tcacgacgag atcatcgccg 8280 
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fccgggcatgc gcgccttgag cctggcgaac agtfccggctg gcgcgagccc ctgatgcfcct 8340 

tcgtccagat catcctgatc gacaagaccg gcttccafccc gagtacgtgc tcgctcgatg 8400 

cgatgtttcg cttggtggtc gaatgggcag gtagccggat caagcgtatg cagccgccgc 3460 

attgcatcag ccatgatgga tactttctcg gcaggagcaa ggtgagatga caggagatcc 8520 

tgccccgcrca cttcgcccaa tagcagccag tcccttcccg cttcagtgac aacgtcgagc 8580 

acagctgcgc aaggaacgcc cgtcgtggcc agccacgata gccgcgctgc ctcgtcctgc 8640 

agttcattca gggcaccgga caggtcggtc ttgacaaaaa gaaccgggcg cccctgcgct 8700 

gacagccgga acacggcggc atcagagcag ccgattgtct gttgtgccca gtcatagccg 8760 

aatagcctct ccacccaagc ggccggagaa cctgcgtgca atccatcttg ttcaatcatg 8820 

cgaaacgatc cagafcccggt gcagattatt tggattgaga gtgaatatga gactctaatt 8880 
ggataccgag gggaatttat ggaacgtcag tggagcattt ttgacaagaa atatttgcta 8940 
■ getgatagfcg ar.ettaaocg acttttaaac gcgcaataat ggtttctgac gtatgtgctt 9000 
agctcattaa actccagaaa cccgcggctg agtggctcct tcaacgttgc ggttctgtca 9060 
gttccaaacg taaaacggct tgtcccgcgt catcggcggg ggtcataacg tgactccctt 9120 
aattctccgc tcatgatcag attgtcgttt cccgccttca gtttaaacta tcagtgtttg 9180 
acaggatata ttggcgggfca aacctaagag aaaagagcgt ttattagaat aatcggatat 9240 
ttaaaagggc gtgaaaaggt ttatccgttc gtccatttgt atgtgcatgc caaccacagg 9300 
gttccccaga tctggcgccg gccagcgaga cgagcaagat tggccgccgc ccgaaacgat 9360 
ccgacagcgc gcocagoaca ggtgegeagg fjaaafctgcac caacgcatac ascgccagca 9420 
gaatgccata gtgggcggtg acgtcgttcg agtgaaccag atcgcgcagg aggcccggca 9480 
gcaccggcat aatcaggccg atgccgacag cgtcgagcgc gacagtgctc agaattacga 9540 
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tcaggggtat gttgggtttc acgtctggcc 
cgcgcggatt cttfcatcact gafcaagttgg 
gfccaagcafcg acaaagttgc agccgaatac 

cgaggtcggc gtagacggtc tgacgacacg 
gccggcgctt tactggcact tcaggaacaa 
catgctggcg gagaatcata cgcattcggt 
tctgatcgcrg aatgcccgca gcttcaggca 
catccatgcc ggcacgcgac cgggcgcacc 
cttcctctgc gaggcgggtt tttcggccgg 
ctacttcact gttggggccg tgcttgagga 
cggcggcacc gttgaacagg ctccgctctc 
cgacgaagcc ggtccggacg cagcgttcga 
ggcgaaaagg aggctcgttg tcaggaacgt 
aggaccg-ctg ccggagqgca aoceactcac 
ccccctttcc accgcgtcag acgcccgtag 
cctagcgtcc aagcctcacg gccgcgctcg 
gctfcccfccgc tcactgactc gctgcgctcg 
cactcaaagg cggtaatacg gttafcccaca 
tgagcaaaag gccagcaaaa ggccaggaac 
cataggctcc gcccccctga cgagcatcac 
aea.cccga.cag gactataaag ataccaggcg 



PCT/EP2004/000100 

47/358 

tccggaccag cctccgctgg tccgafctgaa 9600 
tggacatatt atgtttatca gtgataaagt 9660 
agtgofcccgfc gccgccctgg acctgttgaa 9720 

caaactggcg gaacggttgg gggttcagca 9780 
gcgggcgctg ctcgacgcac tggccgaagc 9840 
gccgagagcc gacgacgact ggogctcatt 9900 
ggcgctgctc gcctaccgcg atggcgcgcg 9960 

gcagatggaa acggccgacg cgcagcttcg 10020 

ggacgccgtc aatgcgctga tgacaatcag 10080 

gcaggccggc gacagcgatg ccggcgagcg 10140 

gccgctgttg cgggccgcga tagacgcctt 10200 

gcagggactc gcggtgattg tcgatggatt 10260 

tgaaggaccg agaaagggtg acgattgatc 10320 

taoagcagag ooafcgtagac aacatoceot 103 SO 

cagcccgcta cgggcttttt catgccctgc 10440 

gcctctctgg cggccttctg gcgctcttcc 10500 

gtcgttcggc tgcggcgagc ggtatcagct 10560 

gaatcagggg ataacgcagg aaagaacatg 10620 

cgtaaaaagg ccgcgfctgct ggcgtttttc 10680 

aaaaafccgac gctcaagtca gaggtggcga 10740 

tttccccctg gaagctccct cgfcgcgctcfe 10600 



WO 2004/063358 PCT/EP2004/000100 
148/358 

cctgttccga ccctgccgct taccggatac ctgfcccgcct ttctcccttc gggaagcgtg 10860 
gcgcttttcc gctgcataac cctgcttcgg ggtcattata gcgatttttt cggtatatcc 10920 
afccctttttc gcacgatata caggattttg ccaaagggtt cgfcgtagacb ttcctfcggtg 10980 
tatccaacgg cgtcagccgg gcaggatagg tgaagtaggc ccacccgcga gcgggtgttc 11040 
cttcttcact gtcccttatt cgcacctggc ggtgctcaac gggaatcctg cfcctgcgagg 11100 
ctggccggct accgccggcg taacagatga gggcaagcgg atggctgatg aaaccaagcc 11160 
aaccaggaag ggcagcccac ctatcaaggt gtactcrcctt ocagacgaac gaagagr.gsi-. 11250 
tgaggaaaag gcggcggcgg ccggcatgag cctgtcggcc tacctgctgg ccgtcggcca 11280 
gggctacaaa atcacgggcg tcgtggacta tgagcacgtc cgcgagctgg cccgcatcaa 11340 
tggcgacctg ggccgcctgg gcggcctgct gaaactctgg ctcaccgacg acccgcgcac 11400 
ggcgcggttc ggtgatgcca cgatcctcgc cctgctggcg aagatcgaag agaagcagga 11460 
cgagcttggc aaggtcatga tgggcgtggt ccgcccgagg gcagagccat gactttttta 11520 
gccgctaaaa cggccggggg gtgcgcgtga ttgccaagca cgtccccatg cgctccatca 11580 
agaagagcga ettcgcggag etggtgaagt acateaccga cgagcaaggc aagaoogago 11640 
gcctttgcga cgctcaccgg gctggttgcc ctcgccgctg ggctggcggc cgtctatggc 11700 
cctgcaaacg cgccagaaac gccgtcgaag ccgtgtgcga gacaccgcgg ccgccggcgt 11760 
tgtggatacc tcgcggaaaa cttggccctc actgacagat gaggggcgga cgttgacact 11820 
tgaggggccg actcacccgg cgcggcgttg acagatgagg ggcaggctcg atttcggccg 11880 
gcgacgtgga gctggccagc cfccgcaaatc ggcgaaaacg cctgatfctta cgcgagtttc 11940 
ccacagatga tgtggacaag cctggggata agtgccctgc ggtattgaca' cttgaggggc 12000 
gogactaatg acagatgagg ggcgagatce fctgacaottg aggggcagng tgctgacaga 12060 
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tgaggggcgc acctattgac atttgagggg ctgtccacag gcagaaaatc cagcatttgc 12120 

aagggtttcc gcccgttttt cggccaccgc taacctgtct tttaacctgc ttttaaacca 12180 

atatttataa accttgtfctt taaccagggc tgcgccctgt gcgcgtgacc gcgcacgccg 12240 

aaggggggtg cccccccttc tcgaaccctc ccggcccgct aacgcgggcc tcccatcccc 12300 

ccaggggctg cgcccctcgg ccgcgaacgg cctcacccca aaaatggcag cgctggcagt 12360 

ccttgccatt gccgggatcg gggcagtaac gggatgggcg atcagcccga gcgcgacgcc 12420 

cggaagcatt gacgtgccgc aggtgctggc atcgacattc agcgaccagg tgecgggcag 124R0 

tgagggcggc ggcctgggtg gcggcctgcc cttcacttcg gccgtcgggg cattcacgga 12540 

cttcatggcg gggccggcaa tttttacctt gggcattctt ggcatagtgg tcgcgggtgc 12600 

cgtgctcgtg ttcgggggtg cgataaaccc agcgaaccat ttgaggtgat aggtaagatt 12660 

ataccgaggt atgaaaacga gaattggacc tttacagaat tactcfcatga agcgccatat 12720 

ttaaaaagct accaagacga agaggatgaa gaggatgagg aggcagattg ccttgaatat 12780 

attgacaata ctgataagat aatatatctt ttatatagaa gatatcgccg tatgfcaagga 12840 

tttcaggggg caaggcatag gcagcgogct tatoaatata tctatagaat gggcaaagoa 12900 

taaaaacttg catggacfcaa tgcttgaaac ccaggacaat aaccttatag cttgtaaatt 12960 

ctatcataat tgggtaafcga ctccaactta fctgatagtgt tttatgttca gataatgccc 13020 

gatgactttg tcatgcagct ccaccgattt tgagaacgac agcgacttcc gtcccagccg 13080 

tgccaggtgc tgcctcagafc fccaggttatg ccgctcaatt cgctgcgtat atcgcttgct 13140 

gattacgtgc agctttccct tcaggcggga ttcatacagc ggccagccat ccgtcatcca 13200 

tatcaccacg tcaaagggtg acagcaggct cataagacgc cccagcgtcg ccatagtgcg 13260 

fctcaccgaat acgtgcgcaa caaccgtctt ccggagactg tcntacgcgt aaaacagcca 1332 0 
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gcgctggcgc gafcttagcce cgacatagcc ccactgttcg tecatttccg cgcagacgat 133 80 

gacgtcactg cccggctgta tgcgcgaggt taccgactgc ggcctgagtt ttttaagtga 13440 

cgtaaaatcg tgttgaggcc aacgcccata atgcgggctg ttgccoggca tccaacgcca 13500 

ttcatggcca tatcaatgat tttcfcggtgc gtaccgggtt gagaagcggt gtaagtgaac 13560 

tgcagttgcc atgttttacg gcagtgagag cagagatagc gctgatgtcc ggcggtgctt 13620 

ttgccgttac gcaccacccc gtcagtagct gaacaggagg gacagctgafc agacacagaa 13680 

gccactggag cacctcaaaa acaccatcat acactaaatc agtaagttgg cagcatcacc 13740 

cataattgtg gtttcaaaat cggctccgtc gatactatgt tatacgccaa ctttgaaaac 13800 

aactttgaaa aagctgtttc ctggtattta aggttttaga atgcaaggaa cagtgaattg 13860 

gagttcgtct tgfctataatt agcttcttgg ggtatcttta aatactgtag aaaagaggaa 13920 

ggaaataata aatggctaaa atgagaatat caccggaatt gaaaaaactg atcgaaaaat 13980 

accgctgcgt aaaagatacg gaaggaatgt ctcctgctaa ggtatataag ctggtgggag 14040 

aaaatgaaaa cctatattta aaaatgacgg acagccggta taaagggacc acctatgatg 14100 

fcggaacggga aaaggacatg atgctatggc tggaaggaaa gctgcctgtt ccaaaggtcc 14160 

tgcactttga acggcatgat ggctggagca atctgctcat gagtgaggcc gatggcgtcc 14220 

tttgctcgga agagtatgaa gatgaacaaa gccctgaaaa gattatcgag ctgtatgcgg 14280 

agtgcafccag gctctttcac tccatcgaca tatcggattg 'fcccctatacg aatagcttag 14340 

acagccgctt agccgaattg gattacttac tgaataacga tctggccgat gtggattgcg 14400 

aaaactggga agaagacact ccafcttaaag atccgcgcga gctgtatgat tttttaaaga 14460 

cggaaaagcc cgaagaggaa cttgtctttt cccacggcga cctgggagac agcaacatct 14520 
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If 

ttgtgaaaga fcggcaaagta agtggcttfca 
agtggtatga cattgccttc fcgcgtccggt 
atgtcgagct attttttgac ttactgggget 
atattttact ggatgaattg ttttagtacc 
caggagcgca ccgacttctt ccgcatcaag 
aagtatttgg gcaaggggtc gctggtatfcc 
gagaaggacg gccagacggt ctacgggacc 
gacaccaagg caccaggcgg gtcaaatcag 
ggggcaatcc cgcaaggagg gtgaatgaat 
gaactgatcg acgcggggtt ttccgccgag 
atgcgtgcgc cccgcgaaac cttccagtcc 
aagatcgagc gcgacagcgt gcaactggct 
gtggagcgtt cgcgtcgtct cgaacaggag 
gacacgcgag gaactatgac gaccaagaag 
caggtcagcg aggccaagca ggccgcgttg 
atgcagcttt ccttgttcga tattgcgccg 
gacacggccc gctctgccc't gttcaccacg 
caaaacaagg tcattttcca cgtcaacaag 
ctgcgggccg acgatgacga actggtgtgg 
cctatcggcg agccgatcac cttcacgttc 
atcaatggcc ggtattacac gaaggccgag 



PCT/EP2004/000100 

il/358 

ttgatcfctgg gagaagcggc agggcggaca 14580 

cgatcaggga ggatatcggg gaagaacagfc 14640 

tcaagccL-gct ttgggagaaa ai.aaaa.LaLL 14700 

tagatgtggc gcaacgatgc cggcgacaag 147 SO 

tgttttggct ctcaggccga ggcccacggc 14820 

gtgcagggca agattcggaa taccaagtac 14880 

gacttcattg ccgataaggt ggattatctg 14940 

gaataagggc acattgcccc ggcgtgagtc 15000 

cggacgtttg accggaaggc atacaggcaa 15050 

gatgccgaaa ccatcgcaag ccgcaccgtc 15120 

gtcggctcga tggtccagca agctacggcc 15180 

occcctgccc tgcccgcgcc atcggccgcc 15240 

gcggcaggtt tggcgaagtc gatgaccatc 15300 

cgaaaaaccg ccggcgagga cctggcaaaa 15360 

ctgaaacaca cgaagcagca gatcaaggaa 15420 

tggccggaca cgatgcgagc gatgccaaac 15480 

cgcaacaaga aaatcccgcg cgaggcgctg 15540 

gacgtgaaga tcacctacac cggcgtcgag 15600 

cagcaggtgt tggagtacgc gaagcgcacc 15660 

tacgagcttt gccaggacct gggctggtcg 15720 

gaatgcctgt cgcgcctaca ggcgacggcg 15780 
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atgggcttca cgtccgaccg cgttgggcac ctggaatcgg tgfccgctgct gcaccgcttc 15840 

cgcgtcctgg accgtggcaa gaaaacgtcc cgttgccagg tcctgatcga cgaggaaatc 15900 

gfccgbgatgfc ttgctggcga ccaotacacg aaattcatat gggagaay U* ccgceagctg 15960 

tcgccgacgg cccgacggat gttcgactat fctcagctcgc accgggagcc gtacccgctc 16020 

aagctggaaa ccttccgcct catgtgcgga tcggattcca cccgcgtgaa gaagtggcgc 16080 

gagcaggtcg gcgaagcctg cgaagagttg cgaggcagcg gcctggtgga acacgcctgg 16140 

gtcaatgatg acctggtgca ttgcaaacgc tagggccttg tggggtcagt tccggctggg 16200 

ggtfccagcag ccagcgcttt actggcattt caggaacaag cgggcaotgc tcgacgcact 16260 

tgcttcgctc agtatcgctc gggacgcacg gcgcgctcta cgaactgccg ataaacagag 1632 0 

gattaaaatt gacaattgtg attaaggctc agattcgacg gcttggagcg gccgacgtgc 16380 

aggatttccg cgagatccga ttgtcggccc tgaagaaagc tccagagatg ttcgggtccg 16440 

tttacgagca cgaggagaaa aagcccatgg aggcgttcgc tgaacggttg cgagatgccg 16500 

tggcattcgg cgcctacatc gacggcgaga tcattgggct gtcggtcttc aaacaggagg 16560 

acggccccaa ggacgctcac aaggcgcatc tgtccggcgt tttcgtggag cccgaacagc 16620 

gaggccgagg ggtcgccggt atgctgctgc gggcgttgcc ggcgggttta ttgctcgtga 16680 

tgatcgtccg acagattcca acgggaatct ggtggatgcg catcttcatc ctcggcgcac 16740 

ttaatatttc gctafctctgg agcttgttgt ttatttcggt ctaccgcctg ccgggcgggg 16800 

tcgcggcgac ggtaggcgct gtgcagccgc tgatggtcgt gttcatctct gccgctctgc 16860 

taggtagccc gatacgattg atggcggtcc tgggggctat ttgcggaact gcgggcgtgg 16920 

cgctgttggt gttgacacca aacgcagcgc tagatcctgt cggcgtcgca gcgggcctgg 16980 

cgggggcggt ttccatggcg ttcggaaccg fcgcfcgacccg caagtggcaa cctcccgtgc 17040 
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ctctgctcac ctttaccgcc tggcaactgg cggccggagg adttctgctc gttccagtag 17100 

ctttagtgtt tgatccgcca atcccgatgc cbacaggaac caatgttctc ggcctggcgt 17160 

ggcfccggcct gatcggageg ggtfcfcoaccb acttcctttg gfctccggggg atctcgcgac 17220 

tcgaacctac agttgtttcc ttactgggct ttctcagccc cagatctggg gtcgatcagc 17280 

cggggatgca tcaggccgac agtcggaact tcgggtcccc gacctgtacc attcggtgag 17340 

caatggatag gggagttgat atcgtcaacg ttcacttcta aagaaafcagc gccactcagc 17400 

ttcctcagcg gctttatcca gcgatttcct attatgtcaa catacrttctc aagatcgaca 17460 

gcctgtcacg gttaagcgag aaatgaataa gaaggctgafc aattcggatc tctgcgaggg 17520 

agatgatatt tgatcacagg cagcaacgct ctgtcatcgt tacaatcaac atgctaccct 17580 

ccgcgagatc atccgtgttt caaacccgge agcttagttg ccgttcttcc gaatagcatc 17640 

ggtaacatga gcaaagtctg ccgccttaca acggctctcc cgctgacgcc gtcccggact 17700 

gatgggctgc ctgtatcgag tggtgatttt gtgccgagct gccggtcggg gagctgttgg 17760 

ctggctggtg gcaggatata ttgtggtgta aacaaattga cgcttagaca acttaataac 17820 

acattffcgga cgtttfcfcaat gtactggggfc ggfcfctfcfcnfct: tfccaccagtg agaagggcaa 17 880 

cagctgattg cccttcaccg cctggccctg agagagttgc agcaagcggt ccacgctggt 17940 

fctgccccagc aggcgaaaat cctgtttgat ggtggttccg aaatcggcaa aatcccttafc 18000 

aaatcaaaag aatagcccga gatagggttg agtgttgttc cagtttggaa caagagtcca 18060 

ctattaaaga acgtggactc caacgtcaaa gggcgaaaaa ccgtctatca gggcgatggc 18120 

ccactacgtg aaccatcacc caaatcaagfc tttttggggt cgaggtgccg taaagcacta 18180 

aatcggaacc ctaaagggag cccccgattt agagcttgac ggggaaagcc ggcgaacgtg 18240 

gegagaaagg aagggaagaa agogaaagga gagggcgoca ttcaggctgc gcaactgttg 103 00 
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ggaagggcga tcggtgcggg cctcttcgct attacgccag ctggcgaaag ggggatgtgc 183 60 
tgcaaggcga ttaagttggg taacgccagg gttttcccag fccacgacgtt gtaaaacgac 18420 
ggccagtgaa ttcgagctcg gtacccggg 18449 

<210> 41 

<211> 18449 

<212> DNA 

<213> Artificial 

<22 0> 

<223> Plasmid 



<220> 

<221> misc_feature 

<222> (3471) (3471) 

<223> n is a, c, g, or t 

<220> 

<221> m±sc_feature 

<222> (3679) .. (3679) 

<223> a is a, c, g, or t 

<220>- 

<221> misc_£eature 

<222> (3770) (3770) 

<223> n is a, c, g, or t 

<400> 41 

gatctttcga cactgaaata cgtcgagcct gctccgcttg gaagcggcga ggagcctcgt 60 

cctgtcacaa ctaccaacat ggagtacgat aagggccagt tccgccagct cattaagagc 120 

cagttcatgg gcgttggcat gatggccgtc atgcatctgt acttcaagta caccaacgct 180 

cttctgatcc agtcgatcat ccgctgaagg cgctttcgaa tctggttaag atccacgtct 240 



Luyyyaaycc agcgactggt gacctccagc gtcccttfcaa ggctgccaac: agctttctca 300 
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gccagggcca gcccaagacc gacaaggcct ccctccagaa cgccgagaag aactggaggg 360 

gtggtgtcaa ggaggagtaa gctccttatt gaagtcggag gacggagcgg tgtcaagagg 420 

atattctfccg actctgtatt atagataaga tgatgaggaa ttggaggtag catagcttca 480 

tttggatttg ctttccaggc tgagactcta gcttggagca tagagggtcc tttggctttc 540 

aatattctca agtatctcga gtttgaactt attcccfcgtg aaccttttat tcaccaatga 600 

gcattggaat gaacatgaat ctgaggactg caatcgccat gaggttttcg aaatacatcc 660 

acratgtccraa acrcttcraccrc acctgcgtta gttsjaattta gaacgtagca cfcattgatoa 720 

tccgatagct ctgcaaaggg cgtfcgcacaa tgcaagtcaa acgttgctag cagttccagg 780 

tggaatgtta tgatgagcat tgtattaaat caggagatat agcatgatct ctagttagct 840 

caccacaaaa gtcagacggc gtaaccaaaa gtcacacaac acaagctgta aggatttcgg 900 

cacggctacg gaagacggag aagccacctt cagtggactc gagtaccatt taattctatt 960 

tgtgtttgat cgagacctaa tacagcccct acaacgacca tcaaagtcgt atagctacca 1020 

gtgaggaagt ggactcaaat cgacttcagc aacatctcct ggataaactt taagcctaaa 1080 

ctatacagaa taagafcaggt ggagagctta taoogagctc ccaaafcctgt oeagatoatg 1140 

gttgaccggt gcctggatct tcctatagaa tcatccttat tcgttgacct agctgattct 1200 

ggagtgaccc agagggtcat gacttgagcc taaaatccgc cgcctccacc atttgtagaa 1260 

aaatgtgacg aactcgtgag ctctgtacag tgaccggtga ctctttctgg catgcggaga 1320 

gacggacgga cgcagagaga agggctgagrt aataagccac tggccagaca gctctggcgg 1380 

ctctgaggtg cagtggatga ttattaatcc gggaccggcc gcccctccgc cccgaagtgg 1440 

aaaggctggt gfcgcccctcg ttgaccaaga atctattgca tcatcggaga atatggagct 1500 

tcatcgaatc accggoagta agcgaaggag aatgtgaetgc caggggbgfca. tagccgtcgg 1560 
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cgaaatagca tgccattaac ctaggtacag aagtccaatt gcttccgatc tggtaaaaga 1620 

ttcacgagat agtaccttct ccgaagtagg tagagcgagt acccggcgcg taagctccct 1680 

aattggccca tccggcafcct gtagggcgtc caaatatcgt gcctctcctg ctttgcccgg 1740 

tgtatgaaac cggaaaggcc gctcaggagc tggccagcgg cgcagaccgg gaacacaagc 1800 

tggcagtcga cccatccggt gctctgcact cgacctgctg aggtccctca gtccctggta 1860 

ggcagctttg ccccgtctgt ccgcccggtg tgtcggcggg gttgacaagg tcgttgcgtc 1920 

agfcnnaacat fctgfctgccafc attttcctgc tctccccacc agctgctctt ttcttttctc 1980 

tttcttttcc catcttcagt atattcatct tcccatccaa gaacctttafc ttcccctaag 2040 

taagtacttt gctacatcca tactccatcc ttcccatccc ttattccttfc gaacctttca 2100 

gtfccgagctt tcccacttca tcgcagcttg actaacagct accccgcttg agcagacatc 2160 

accabgcctg aactcaccgc gacgtctgtc gagaagtttc fcgatcgaaaa gttcgacagc 2220 

gtctccgacc tgatgcagct ctcggagggc gaagaatctc gtgctttcag cttcgatgta 2280 

ggagggcgtg gatafcgtcct gcgggtaaat agctgcgccg atggtttcta caaagatcgt 2340 

fcatgfcttatc ggcaatttgc ateggecgcg ctoccgattc oggaagtgct fcgacafctggg 24.00 

gaattcagcg agagcctgac ctattgcatc tcccgccgtg cacagggtgt cacgttgcaa 2460 

gaactgcctg aaaccgaact gcccgctgtt ctgcagccgg tcgcggaggc catggatgcg 2520 

atcgctgcgg ccgatcttag ccagacgagc gggttcggcc cattcggacc gcaaggaatc 2580 

ggtcaataca ctacatggcg tgatttcata tgcgcgattg ctgatcccca tgtgtatcac 2640 

tggcaaactg tgatggacga caccgfccagt gcgtccgtcg cgcaggctct cgatgagctg 2700 

atgctttggg ccgaggactg ccccgaagtc cggcacctcg tgcacgcgga tttcggctcc 2760 

aaccaLyLcc tgacggncaa tggccgcefca acagcggtca fcfcgactggag cgsggcgafcg 2 820 
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ttcggggatfc cccaatacga ggtcgccaac afccttcttct ggaggccgtg gttggcttgt 2880 

atggagcagc agacgcgcta cttcgagcgg aggcatccgg agcttgcagg atcgccgcgg 2940 

ctccgggcgt atatgctccg cattggtctt gaccaactct atcagagctt ggttgacggc 3000 

aatttcgatg atgcagcfctg ggcgcagggt cgatgcgacg caatcgtccg atccggagcc 3060 

gggactgtcg ggcgtacaca aatcgcccgc agaagcgcgg ccgtctggac cgatggctgt 3120 

gtagaagtac tcgccgatag tggaaaccga cgccccagca ctcgtccgag ggcaaaggaa 3180 

tagagtagafc gccgaccgccr ggatcgatcc acttaacatt achgaaahna toaaacagct 3240 

tgacgaatct ggatataaga tcgttggtgt cgatgtcagc tccggagttg agacaaatgg 3300 

tgttcaggat ctcgataaga tacgttcatt tgtccaagca gcaaagagtg ccttctagtg 3360 

atttaatagc tccatgfccaa caagaataaa acgcgttfctc gggtttacct cttccagata 3420 

cagctcatct gcaatgcatt aatgcattga ctgcaaccta gtaacgcctt ncaggctccg 3480 

gcgaagagaa gaatagctta gcagagctat tttcattttc gggagacgag atcaagcaga 3540 

tcaacggtcg tcaagagacc tacgagactg aggaatccgc tcttggetcc acgcgactat 3600 

atatttgtct ctaattgtac tttgacatgc fccctcfctctt tactctgata gcttgactat 3660 

gaaaattccg tcaccagcnc ctgggttcgc aaagataatt gcatgtttct tccttgaact 3720 

ctcaagccta caggacacac attcatcgta ggtataaacc tcgaaatcan ttcctacfcaa 3780 

gatggtafcac aatagtaacc atgcatggtt gcctagtgaa tgctccgtaa cacccaatac 3840 

gccggccgaa acttttttac aactctccta tgagtcgttt acocagaatg cacaggtaca 3900 

cttgtttaga ggtaatcctt ctttctagct agaagtcctc gtgtactgtg taagcgccca 3960 

ctccacatct ccactcgacc tgcaggcatg caaagcttga gattaaaata gataaggaaa 4020 
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agaaagtgaa aagaaattcg gaagcatggc acattcttct ttttataaat acafcgccfcga 4080 
ctttcttttt ccatcgatat gatatatgca tatgatagat atacaagcaa tcttcttcaa 4140 
ggag-tttg-sa atfcfctgtccfc ooaggagoua aaaacwicffctt tttfcttaUic stgtttgtac 4200 

acaagaatag ttaccaattt gctttggtct tacgfcgctgc aagtttatat cgttttcaat 4260 

ttctttgtct ttacattttc tttgtccttt atctttcctc atttagtctt tgggagaatt 4320 

aggaaaaggg agcggaaagg taagaaatgc fctgcgtattt tactaafcfccg gcaaacatcc 4380 

aatttggcaa acagcagcct gtgcaacgct ctcgagatga cagtatcttt gafctacactc 4440 

taaatctcga tgacccgacc aaaaagagcg aacaaagaaa taafccttgtg cattcgaata 4500 

tgatggaaga ttttttcccc cttattctaa afcgttgacat agcgtgtatg ttafcataaac 4560 

aaaaaytiaat Lytacaaact ttcttttctt CtcttCttat tttatctcta tgctgtcgaa 462 0 

gctgcagtca atcagcgtca aggcccgccg cgttgaacta gcccgcgaca tcacgcggcc 4680 

caaagtctgc ctgcatgctc agcggtgcfcc gttagttcgg ctgcgagfcgg cagcaccaca ■ 4740 

gacagaggag gcgctgggaa ccgtgcaggc tgccggcgcg ggcgatgagc acagcgccga 4800 

tgtagcactc cagcagcttg accgggctat cgcagagcgt cgtgcccggc gcaaacggga 4860 

gcagctgtca taccaggctg ccgccattgc agcatcaatt ggcgtgtcag gcattgccat 4920 

cttcgccacc tacctgagat ttgccatgca catgaccgtg ggcggcgcag tgccatgggg 4980 

cgaagtggct ggcactctcc tcttggtggt tggtggcgcg ctcggcatgg agatgtatgc 5040 

ccgctatgca cacaaagcca tctggcafcga gtcgcctctg ggctggctgc tgcacaagag 5100 

ccaccacaca cctcgcactg gaccctttga agccaacgac ttgtfctgcaa tcatcaatgg 5160 

actgcccgcc atgctcctgt gtacctttgg cttctggctg cccaacgtcc tgggggcggc 5220 

ctgctttgga gcggggctgg gcatcacgct atacggcatg gcatafcatgt tfcgtacacga 5280 
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tggcctggtg cacaggcgct ttcccaccgg gcccatcgct ggcctgccct acatgaagcg 5340 

cctgacagtg gcccaccagc tacaccacag cggcaagtac ggtggcgcgc cctggggtat 5400 

gfctcfctgggt ccacaggagc tgcagcocat tccetggtgcg gcggaggagg tggctgcgemt 5460 

ggtcctggaa ctggactggt ccaagcgggc gattgtgact gatagcgaga ctctgggtcg 5520 

atgttatctg cctcaacaat ggcttagaaa agaagaaaca gaacaaatac agcaaggcaa 5580 

cgcccgtagc ctaggtgatc aaagactgtt gggcttgtct ctgaagcttg taggaaaggc 5640 

agacgctatc atggtgagag ctaagaaggg cattgacaag ttgccggcaa actgtcaagg 5700 

cggtgtacga gctgcttgcc aagtatatgc tgcaattgga tctgtactca agcagcagaa 57 60 

gacaacatat cctacaagag ctcatctaaa aggaagcgaa cgtgccaaga ttgctctgtt. 5820 

gagtgtatac aacctctatc aatctgaaga caagcctgtg gctctccgtc aagctagaaa b88U 

gattaagagt ttttttgttg attagtgaat ttttgtttta tttatgtctg atagttcaat 5940 

aaagagacaa cacatacaat ataaaatcat tgtctttaaa tgfctaattta gtagagtgta 5000 

aagcctgcat tttttttgta cgcataaaca atgaattcac cccgcttctg gfcttfctaaat 6060 

aattatgtca aactagggaa aattcttttt tttctcttcg ttcttttttt ggcttgttgt 6120 

ggagtcacag gcttgtcttc agattgatag aggttgtata cactcaacag agcaatcttg 6180 

gcacgttcgc ttccttttag atgagctctt gtaggatatg ttgtcttctg ctgcttgagt 6240 

acagatccaa ttgcagcata tacttggcaa gcagctcgta caccgccttg acagtttgcc 6300 

ggcaacttgt caatgccctt cttagctctc accatgatag cgtctgcctt tcctacaagc 6360 

fctcagagaca agcccaacag tctttgatca ccfcaggctac gggcgttgcc ttgctgtatt 6420 

tgttctgfcht cttcttttct aagccattgt tgaggcagat aacafccgacc caacatcctc 6480 

gagccatact acagcataaa aggatacgtt ttcfcttaaca gaaatttacc cttttgttat 6540 
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cagcacatac aaaaaaaaag aaatfctaaga tgagtaggac ttccattctc tcaaaaattt 6600 

tattcaatcc ataaatgaat tatttttgga caaaaaagaa agattatgcc tgattttctc 6660 

tatttttttt tttLLLeicaa cLccacgaat sctttctagc teayutlggt: gtaatcatgg 6720 

taatagctgt ttcctgtgtg aaattgttat ccgctcacaa ttccacacaa catacgagcc 6780 

ggaagcataa agtgfcaaagc ctggggtgcc taatgagtga gctaactcac attaattgcg 6840 

fctgcgctcac tgcccgcttt ccagtcggga aacctgtcgt gccagctgca ttaatgaatc 6900 

ggccaacgcg cggggagagg cggtttgcgt attgggccaa agacaaaagg gcgacattca 6960 

accgattgag ggagggaagg taaatattga cggaaafctat tcattaaagg tgaattatca 7020 

ccgtcaccga cttgagccat ttgggaatta gagccagcaa aatcaccagt agcaccatta 7080 

ccattagcaa ggccggaaac gtcaccaatg aaaccatcga tagcagcacc gtaatcagta 7140 

gcgacagaat caagtttgcc tttagcgtca gactgtagcg cgttttcatc ggcattttcg 7200 

gtcatagccc ccttattagc gtttgccatc tfcttcataat caaaatcacc ggaaccagag 72 60 

ccaccaccgg aaccgcctcc ctcagagccg ccaccctcag aaccgccacc ctcagagcca 7320 

ccaocctcag agocgocaco agaaccacoa ocagagoogo ogocagcatt gacaggagg-c 7380 

ccgatctagt aacatagatg acaccgcgcg agataattta tcctagtttg cgcgctatat 7440 

tttgttttct atcgcgtatt aaatgtataa ttgcgggact ctaatcafcaa aaacccatct 7500 

cataaataac gtcatgcatt acatgttaat tattacatgc ttaacgtaat tcaacagaaa 7560 

ttatatgata atcatcgcaa gaccggcaac aggattcaat cttaagaaac ttfcattgcca 7620 

aatgfcttgaa cgatcgggga tcatccgggt ctgtggcggg aactccacga aaatatccga 7680 

acgcagcaag atatcgcggt gcatctcggt cttgcctggg cagtcgccgc cgangccgtt 7740 

gatgtggacg ccgggcccgn tcatafctgtc gctcagg&tc gtggcgttgt gcLLgLugyc 7800 



WO 2004/063358 PCTVEP20O4/OOO1OO 
161/358 

cgttgctgtc gtaatgatat cggcaccttc gaccgcctgt tccgcagaga tcccgtgggc 7860 

gaagaactcc agcatgagat ccccgcgctg gaggatcatc cagccggcgt cccggaaaac 7920 

gattccgaag cccaaccttt catagaaggc ggcggtggaa tcgaaatctc gtgatggcag 7980 

gttgggcgtc gcttggtcgg tcafcttcgaa ccccagagtc ccgctcagaa gaactcgtca 8040 

agaaggcgat agaaggcgat gcgctgcgaa tcgggagcgg cgataccgta aagcacgagg 8100 

aagcggtcag cccattcgcc gccaagctct tcagcaatat cacgggtagc caacgctatg 8160 

tcctgatagc yyLcuyccctc agccagcogg coacagtcga tgaatccaga aaagoggaoa 8220 

ttttccacca tgatattcgg caagcaggca tcgccatggg tcacgacgag atcatcgccg 8280 

tcgggcatgc gcgccttgag cctggcgaac agttcggctg gcgcgagccc ctgatgctct 8340 

tcgtccagat catcctgatc gacaagaccg gcttccatcc gagtacgtgc tcgctcgatg 8400 

cgatgfcttcg cttggtggtc gaatgggcag gtagccggat caagcgtatg cagccgccgc 8460 

attgcatcag ccatgatgga tactttctcg gcaggagcaa ggtgagatga caggagatcc 8520 

tgccccggca cttcgcccaa tagcagccag tcccttcccg cttcagtgac aacgtcgagc 8580 

acagctgcgc aaggaacgcc cgtcgtggcc agccacgata gccguyctyc utcgtcctge 8G40 

agttcattca gggcaccgga caggtcggtc ttgacaaaaa gaaccgggcg cccctgcgct 8700 

gacagccgga acacggcggc atcagagcag ccgattgtct gtfcgtgccca gtcatagccg 8760 

aatagcctct ccacccaagc ggccggagaa cctgcgtgca atccatcttg ttcaatcatg 8820 

cgaaacgatc cagatccggt gcagattatt tggattgaga gtgaatatga gactctaatt 8880 

ggataccgag gggaatttafc ggaacgfccag tggagcattt ttgacaagaa atatttgcta 8940 

gctgatagtg accttaggcg acttttgaac gcgcaataat ggtttctgac gtatgtgctt 9000 

agctcattaa actccagaaa cccgcggctg agtggctcct tcaacgttgc ggttctgtca 9060 
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gttccaaacg taaaacggct tgfceccgcgt catcggcggg ggtcataacg tgactccctt 9120 

aattctccgc tcatgatcag attgtcgttt cccgccttca gtttaaacta tcagtgtttg 9180 

acaggatata ttggcgggta aaccfcaagag aaaagagcgfc ttattagaat aatcggatat 9240 

ttaaaagggc gtgaaaaggt ttatccgttc gtccatttgt atgtgcatgc caaccacagg 9300 

gttccccaga tctggcgccg gccagcgaga cgagcaagat tggccgccgc ccgaaacgat 9360 

ccgacagcgc gcccagcaca ggtgcgcagg caaattgcac caacgcatac agcgccagca 9420 

gaatgccata gtgggcggtg acgtcyLLug agtgaaccag otcgogcagg aggccoggca 9480 

gcaccggcat aatcaggccg atgccgacag cgtcgagcgc gacagtgctc agaattacga 9540 

tcaggggtat gttgggtttc acgtctggcc tccggaccag cctccgctgg tccgattgaa 9600 

cgcgcggatt ctttatcact gataagttgg tggacatatt atgtttatca gtgataaagt 9660 

gtcaagcatg acaaagttgc agccgaatac agtgatccgt gccgcccfcgg acctgttgaa 972 0 

cgaggtcggc gtagacggtc tgacgacacg caaactggcg gaacggttgg gggttcagca 9780 

gccggcgctt tactggcact tcaggaacaa gcgggcgctg ctcgacgcac tggccgaagc 9840 

catgctggcg gagaatcata cgcattcggt gccgagagcc gacgacgctct ggcgctcatt 9900 

tctgatcggg aatgcccgca gcttcaggca ggcgctgctc gcctaccgcg atggcgcgcg 9960 

catccatgcc ggcacgcgac cgggcgcacc gcagatggaa acggccgacg cgcagcttcg 10020 

cttcctctgc' gaggcgggtt tttcggccgg ggacgccgtc aafcgcgctga tgacaatcag 10080' 

ctactfccact gttggggccg tgcttgagga gcaggccggc gacagcgatg ccggcgagcg 10140 

cggcggcacc gttgaacagg ctccgctctc gccgctgttg cgggccgcga tagacgcctt 10200 

cgacgaagcc ggtccggacg cagcgttcga gcagggactc gcggtgattg tcgatggatt 10260 

ggcgaaaagg aggctcgttg tcaggaacgt 'tgaaggaccg agaaagggtg acgattgatc 10320 
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aggaccgctg ccggagcgca acccactcac tacagcagag ccatgtagac aacatcccct 10380 

cccccfcttcc accgcgtcag acgcccgtag cagcccgcta cgggctttfct catgccctgc 10440 

cctagcgtcc aagcctcacg gccgcgctcg gcctctctgg cggccttctg gcgctcttcc 10500 

gcttcctcgc fccacfcgactc gctgcgctcg gtcgttcggc tgcggcgagc ggtatcagct 10560 

cactcaaagg cggtaatacg gttatccaca gaatcagggg ataacgcagg aaagaacatg 10620 

tgagcaaaag gccagcaaaa ggccaggaac cgtaaaaagg ccgcgttgcfc ggcgtttttc 10680 

cataggctcc gcccccctga cgagcatcac aaaaatcgac gctcaagtca gaggtggcga 10740 

aacccgacag gactataaag ataccaggcg tttccccctg gaagctccct cgtgcgctct 10800 

cctgttccga ccctgccgct taccggatac ctgtccgcct ttctcccttc gggaagcgtg 10860 

gcgcttttcc gctgcataac cctgcttcgg ggtcattata gcgatttttt cggtatatcc 10920 

atcctttttc gcacgatata caggattttg ccaaagggtt cgtgtagact ttccttggtg 10980 

tatccaacgg cgtcagccgg gcaggatagg tgaagtaggc ccacccgcga gcgggtgttc 11040 

cttcttcact gtcccttatt cgcacctggc ggtgctcaac gggaatcctg ctctgcgagg 11100 

ctggccggct accgccggcg taacagatga gggcaagcgg atggctgatg aaaccaagcc 11160 

aaccaggaag ggcagcccac ctatcaaggt gtactgcctt ccagacgaac gaagagcgat 11220 

tgaggaaaag gcggcggcgg ccggcatgag cctgtcggcc tacctgctgg ccgtcggcca 11280 

gggctaeaaa atcacgggcg tcgtggacta tgagcacgtc cgcgagctgg cccgcatcaa 11340 

tggcgacctg ggccgcctgg gcggcctgct gaaactctgg ctcaccgacg acccgcgcac 11400 

ggcgcggttc ggtgatgcca cgatcctcgc cctgctggcg aagatcgaag agaagcagga 11460 

cgagcttggc aaggtcatga tgggcgtggt ccgcccgagg gcagagccat gactttttta 11520 
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gccgctaaaa cggccggggg gtgcgcgtga 
agaagagcga cttcgcggag ctggtgaagt 
gccfettgcga cgcfccaccgg gctggtfcgcc 
cctgcaaacg cgccagaaac gccgtcgaag 
fcgtggatacc tcgcggaaaa cttggccctc 
tgaggggccg actcacccgg cgcggcgfctg 
gcgacgtgga gctggccagc cfccgcaaatc 
ccacagatga tgtggacaag cctggggata 
gcgactactg acagatgagg ggcgcgatcc 
tgaggggcgc acctattgac atttgagggg 
aagggtttcc gcccgttttt cggccaccgc 
atatttataa accttgtttt taaccagggc 
aaggggggtg cccccccttc tcgaaccctc 
ccaggggctg cgcccctcgg ccgcgaacgg 
ccttgccatt gccgggatcg gggcagfcaac 
cggaagcatt gacgtgccgc aggtgctggc 
tgagggcggc ggcctgggtg gcggcctgcc 
cttcatggcg gggccggcaa tttttacctt 
cgtgctcgtg ttcgggggtg cgataaaccc 
ataccgaggt atgaaaacga gaattggacc 
ttaaaaagct accaagacga agaggatgaa 
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ttgccaagca cgtccccatg cgctccafcca 11580 

acatcaccga cgagcaaggc aagaccgagc 11640 

ctcgccgctg ggcfcggcggc cgfcctatggc 11700 

ccgtgtgcga gacaccgcgg ccgccggcgt 11760 

actgacagat gaggggcgga cgttgacact 11820 

acagatgagg ggcaggctcg atttcggccg 11880 

ggcgaaaacg cctgatttta cgcgagtttc 11940 

agtgccctgc ggtattgaca cttgaggggc 12000 

ttgacacttg aggggcagag tgctgacaga 12060 

ctgtccacag gcagaaaatc cagcatctgc 12120 

taacctgtct fcttaacctgc ttttaaacca 12180 

tgcgccctgt gcgcgtgacc gcgcacgccg 12240 

ccggcccgct aacgcgggcc tcccatcccc 12300 

cctcacccca aaaatggcag cgctggcagt 12360 

gggatgggcg atcagcccga gcgcgacgcc 12420 

atcgacattc agcgaccagg tgccgggcag 12480 

cttcacttcg gccgtcgggg cattcacgga 12540 

gggcattctt ggcatagtgg tcgcgggtgc 12600 

agcgaaccat ttgaggtgat aggtaagatt 12660 

tttacagaat tactctatga agcgcc&fcat 12720 

gaggatgagg aggcagattg ccttgaatat 12780 
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16 

attgacaata ctgataagat aatatatctt 
tttcaggggg caaggcatag gcagcgcgct 
taaaaacttg catggactaa tgcttgaaac 
ctatcataat tgggtaatga ctecaactta 
gafcgactttg tcatgcagct ccaccgattt 
tgccaggtgc tgcctcagat tcaggttatg 
gattacgtgc agctttccct tcaggcggga 
tatcaccacg tcaaagggtg acagcaggct 
ttcaccgaat acgtgcgcaa caaccgtctt 
gcgctggcgc gatttagccc cgacatagcc 
gacgtcactg cccggctgta tgcgcgaggt 
cgtaaaatcg tgttgaggcc aacgcccata 
ttcatggcca tatcaatgat tttctggtgc 
tgcagttgcc atgttttacg gcagtgagag 
ttgccgttac gcaccacccc gtcagtagct 
gccactggag cacctcaaaa acaccatcat 
cataattgtg gtttcaaaat cggctccgtc 
aactttgaaa aagctgtttt ctggtattta 
gagfetegtcfc tgtfcataatt agcfctcttgg 
ggaaataata aatggctaaa atgagaatat 
accgctgcgt aaaagatacg gaaggaatgt 
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ttatatagaa gatatcgccg tatgtaagga 12840 

tatcaatata tcfcatagaat gggcaaagca 12900 

ccaggacaat aaccttatag cttgtaaatt 12960 

ttgatagtgt tttatgfctca gataatgccc 13020 

tgagaacgac agcgacttcc gfccccagccg 13080 

ccgchcaatt cgctgcgtat atcgcttgct 13140 

ttcatacagc ggccagccat ccgtcatcca 13200 

cataagacgc cccagcgtcg ccatagtgcg 13260 

ccggagactg tcatacgcgt aaaacagcca 13320 

ccactgttcg tccatttccg cgcagacgat 13380 

taccgactgc ggcctgagtt ttttaagtga 13440 

atgcgggctg ttgcccggca tccaacgcca 13 5 00 

gtaccgggtt gagaagcggt gtaagtgaac 13560 

cagagafcagc gctgatgtcc ggcggtgctt 13620 

gaacaggagg gacagctgat agacacagaa 13680 

acactaaatc agtaagttgg cagcatcacc 13740 

gatactatgt tatacgccaa ctttgaaaac 13 800 

aggttttaga atgcaaggaa cagtgaattg 13860 

ggfcafccfctta aatactgtag aaaagaggaa 13920 

caccggaatt gaaaaaactg atcgaaaaat 13980 

ctcctgcfcaa ggtatataag ctggtgggag 14040 
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aaaatgaaaa cctafcattta aaaatgacgg acagccggta taaagggacc acctafcgatg 14100 

tggaacggga aaaggacatg atgcfcatggc tggaaggaaa gctgcctgtt ccaaaggtcc 14160 

tgcactttga acggcatgat ggctggagca atctgctcat gagtgaggcc gatggcgtcc 14220 

tttgctcgga agagtatgaa gatgaacaaa gccctgaaaa gattatcgag ctgtatgcgg 14280 

aatcjcatcag gctctttcac tccatcgaca tatcggattg tccctatacg aatagcttag 14340 

acagccgctt agccgaattg gattacttac tgaataacga tctggccgat gtggattgcg 14400 

aaaactggga agaagacact ccatttaaag atccgcgcga gctgtatgat tttttaaaga 14460 

cggaaaagcc cgaagaggaa cttgtctttt cccacggcga cctgggagac agcaacatct 14520 

ttgtgaaaga tggcaaagta agtggcttta ttgatcttgg gagaagcggc agggcggaca 14580 

agtggtafcga cattgccttc tgcgtccggt cgatcaggga ggatatcggg gaagaacagt 14640 

atgtcgagct attttttgac ttactgggga tcaagcctga ttgggagaaa ataaaatatt 14700 

atattf-.l-.act ggatffaattg ttttagtacc tagatgtggc gcaacgatgc cggcgacaag 14760 

caggagcgca ocgacttctt ccgcatcaag tgttttggct ctcaggccga ggcccacggc 14820 

aagtatttgg gcaaggggtc gctggcattc gtgcagggca. agattcggaa taccaeigtac 14880 

gagaaggacg gccagacggt ctacgggacc gacttcattg ccgataaggt ggattatctg 14940 

gacaccaagg caccaggcgg gtcaaatcag gaataagggc acattgcccc ggcgfcgagtc 15000 

ggggcaatcc cgcaaggagg gtgaatgaat cggacgtttg accggaaggc atacaggcaa 15060 

gaacfcgatcg acgcggggtt ttccgccgag gatgccgaaa ccatcgcaag ccgcaccgfcc 15120 

atgcgtgcgc cccgcgaaac cttccagtcc gfccggctcga tggtccagca agctacggcc 15180 

aagatcgagc gcgacagcgt gcaactggct ccccctgccc tgcccgcgcc atcggccgcc 15240 

gtggagcgtt cgcgtcgtct cgaacaggag gcggcaggte tggcgaagtc gatgaccatc 153 00 
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gacacgcgag gaactatgac gaccaagaag cgaaaaaccg ccggcgagga cctggcaaaa 15360 

caggtcagcg aggccaagca ggccgcgttg ctgaaacaca cgaagcagca gatcaaggaa 15420 

atgcagcttt ccttgttcga tattgcgccg tggccggaca cgabgcgagc gatgccaaac 15480 

gacacggccc gctctgccct gttcaccacg cgcaacaaga aaatcccgcg cgaggcgctg 15540 

caaaacaagg tcattttcca cgtcaacaag gacgtgaaga tcacctacan cggcgtcgag 15600 

cfcgcgggccg acgafcgacga actggtgtgg cagcaggtgt fcggagfcacgc gaagcgcacc 15660 

cctatcagcg agccgateae etteacgtte tacgagcjtfct gccaggacct gggcfcggfccg 1572 0 

atcaatggcc ggtattacac gaaggccgag gaatgcctgt cgcgcctaca ggcgacggcg 15780 

atgggcttca cgtccgaccg cgttgggcac ctggaatcgg fcgtcgctgct gcaccgcttc 15840 

cgcgtcctgg accgtggcaa gaaaacgtcc cgttgccagg tcctgatcga cgaggaaatc 15900 

gtcgtgctgt ttgctggcga ccactacacg aaattcatat gggagaagta ccgcaagctg 15960 

tcgccgacgg cccgacggat gttcgactat ttcagctcgc accgggagcc gtacccgctc 16020 

aagctggaaa ccttccgcct catgtgcgga tcggattcca cccgcgtgaa gaagtggcgc 16080 

gagcsaggtcg gogaagoctg cgaagagttg cgaggcagcg gcctggfcgga acacgqctgg 16140 

gtcaatgatg acctggtgca ttgcaaacgc tagggccttg tggggtcagt tccggctggg 16200 

ggttcagcag ccagcgcttt actggcattt caggaacaag cgggcactgc tcgacgcact 16260 

tgcttcgctc agtatcgctc gggacgcacg gcgcgctcta cgaactgccg ataaacagag 16320 

gattaaaatt gacaattgtg attaaggctc agattcgacg gcttggagcg gccgacgtgc 16380 

aggatttccg cgagatccga ttgfccggccc tgaagaaagc tccagagatg ttcgggtccg 16440 

tttacgagca cgaggagaaa aagcccatgg aggcgttcgc tgaacggttg cgagatgccg 15500 

tggcsttcgg cgcctacatc gacggcgaga tcattgggct gtcggtcttc aaacaggagg 16560 



16980 
17040 
17100 
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acggccccaa ggacgctcac aaggcgcafcc tgtccggcgt tttcgtggag cccgaacagc 1662 0 
gaggccgagg ggtcgccggt atgctgctgc gggcgttgcc ggcgggttta ttgctcgtga 16680 
tgatcgtccg acagattcca acgggaatct ggtggatgcg catcfctcatc ctcggcgcac 16740 
ttaatatttc gctat'tctgg agcttgttgt ttatttcggt ctaccgcctg ccgggcgggg 16800 
tcgcggcgac ggtaggcgct gtgcagccgc tgatggtcgt gttcatctct gccgctctgc 16860 
taggtagccc gatacgattg atggcggtcc tgggggctat ttgcggaact gcgggcgtgg 16920 
cgctgttggt; gttgacaccei aacgcagcgc tagafcccfcgt cggcgtcgoa gegggcctgg 
cgggggcggt ttccatggcg ttcggaaccg tgctgacccg caagtggcaa cctcccgtgc 
ctctgctcac ctttaccgcc tggcaactgg cggccggagg acttcfcgctc gttccagtag 
ctttagtgtt tgatccgcca atcccgatgc ctacaggaac caatgttctc ggcctggcgt 17160 
ggcteggcct gatcggagcg ggtttaacct actfccctttg gttccggggg atctcgcgac 17220 
tcgaaccfcac agttgttfccc ttactgggct ttctcagccc cagatctggg gtcgatcagc 17280 
cggggatgca tcaggccgac agtcggaact tcgggtcccc gacctgtacc attcggtgag 17340 
caatggatag gggagttgat atcgtcaacg ttcacttcta. aagaaatagc gccactcagc 17400 
ttcctcagcg gctttatccs gcgatttcct attatgtcgg catagttctc aagatcgaca 17460 
gcctgtcacg gttaagcgag aaatgaataa gaaggctgat aattcggatc tctgcgaggg 17520 
agatgatatt tgatcacagg cagcaacgct ctgtcatcgt tacaatcaac atgctaccct 17580 
ccgcgagatc atccgtgttt caaacccggc agcttagtfcg ccgttcttcc gaatagcatc 17640 
ggtaacafcga gcaaagtctg ccgcctfcaca acggctctcc cgctgacgcc gtcccggact 17700 
gatgggctgc ctgtatcgag tggtgatttt gtgccgagct gccggtcggg gagctgttgg 17760 
ctggctggtg gcaggatafca ttgtggtgta aacaaattga cgcttagaca acttaataac 17820 
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acattgcgga cgtttttaat gtactggggt ggtttttctt ttcaccagtg agacgggcaa 17880 

cagctgattg cccttcaccg cctggccctg agagagttgc agcaagcggt ccacgcfcggt 17940 

ttgccccagc aggcgaaaat cctgtttgat ggtggttccg aaafccggcaa aatcccttat 18000 

aaatcaaaag aatagcccga gatagggttg agtgttgttc cagtttggaa caagagtcca 18060 

ctahtaaaga acgtggactc caacgtcaaa gggcgaaaaa ccgtctatca gggcgatggc 18120 

ccactacgtg aaccatcacc caaatcaagt tttttggggt cgaggtgccg taaagcacta 18180 

aatcggaacc Ctaaagggag cccccgattt ayeigettgctt; ggggaaagcc ggcgaacgtg 10240 

gcgagaaagg aagggaagaa agcgaaagga gcgggcgcca ttcaggctgc gcaactgttg 18300 

ggaagggcga tcggtgcggg cctcttcgct attacgccag ctggcgaaag ggggatgtgc 18360 

tgcaaggcga ttaagttggg taacgccagg gfctttcccag tcacgacgtt gtaaaacgac 18420 

ggccagtgaa ttcgagctcg gtacccggg 18449 



<210> 42 

<211> 17593 

<212> DMA 

<213> Artificial 

<220> 

<223> Plasmid 
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<221> misc_feature 

<222> (10264) (10264) 

<223> n is a, c, g, cor fc 

<220> 

<221> misc_feature 

<222> (10472} .. (10472) 
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<220> 

<221> miscuEeabure 
<222> (10563) .. (10563) 
<223> n is a, c, g, or t 

<400> 42 

ccgggctggt tgccctcgcc gctgggctgg cggccgtcta tggcccfcgca aacgcgccag 60 

aaacgccgtc gaagccgtgt gcgagacacc gcggccgccg gcgttgtgga taccfccgcgg 120 

aaaacttggc cctcactgac agatgagggg cggacgfctga cacttgaggg gccgactcac ISO 

ccggcgcggc gttgacagat gaggggcagg ctcgcLt.LL.eg gccggcgetcg tggagctggc 240 

cagcctcgca aatcggcgaa aacgcctgat tttacgcgag tttcccacag atgatgtgga 300 

caagccfcggg gataagtgcc ctgcggtatt gacacttgag gggcgcgact actgacagat 360 

gaggggcgcg atccttgaca cttgaggggc agagtgcfcga cagatgaggg gcgcacctat 420 

tgacatttga ggggctgtcc acaggcagaa aatccagcat ttgcaagggt ttccgcccgt 480 

ttttcggcca ccgctaacct gtcttttaac ctgcttttaa accaatattt ataaaccttg 540 

tttttaacca gggctgcgcc ctgtgcgcgt gaccgcgcac gccgaagggg ggtgcccccc 600 

cttctcgaac cctcccggcc cgctaacgcg ggcctcccat ccccccaggg gctgcgcccc 6S0 

tcggccgcga acggcctcac cccaaaaatg gcagcgctgg cagtccttgc cattgccggg 720 

atcggggcag taacgggatg ggcgatcagc ccgagcgcga cgcccggaag cattgacgtg 780 

ccgcaggtgc tggcatcgac attcagcgac caggtgccgg gcagtgaggg cggcggcctg 840 

ggtggcggcc tgcccttcac ttcggccgtc ggggcattca cggacttcat ggcggggccg 900 

gcaattttta ccttgggcat tcttggcafca gtggtcgcgg gtgccgtgct cgtgttcggg 960 

ggtgcgataa acccagcgaa ccatttgagg tgataggtaa gattataccg aggtatgaaa 1020 

acgagaatfcg gacctttaca gaattactct atgaagcgcc atatttaaaa agctaccaag 1080 
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acgaagagga tgaagaggat gaggaggcag attgccttga atatattgac aatactgata 1140 

agataatata tcttttatat agaagatatc gccgtatgta aggatttcag ggggcaaggc 1200 

ataggcagcg cgcttatcaa tatatctata gaatgggcaa agcataaaaa cttgcatgga 1260 

ctaatgcttg aaacccagga caataacctt atagcttgta aattctatca taattgggta 1320 

atgactccaa ctfcattgata gtgttttatg ttcagataat gcccgatgac tttgtcatgc 1380 

agctccaccg attttgagaa cgacagcgac ttccgtccca gccgtgccag gtgctgcctc 1440 

agattcaggt tatgccgctc aattcgctgc gtatatcgct tgctgattac gtgcagcttt 1500 

cccttcaggc gggattcata cagcggccag ccatccgtca tccatatcac cacgtcaaag 1560 

ggtgacagca ggctcataag acgccccagc gtcgccatag fcgcgttcacc gaatacgtgc 1620 

gcaacaaccg tcttccggag actgtcatac gcgtaaaaca gccagcgctg gcgcgattta 1680 

gccccgacat agccccactg ttcgtccatt tccgcgcaga cgafcgacgtc actgcccggc 1740 

tgtatgcgcg aggttaccga ctgcggcctg agttttttaa gtgacgtaaa atcgtgttga 1800 

ggccaacgcc cataatgcgg gctgttgccc ggcatccaac gccattcatg gccatatcaa 1860 

tgattttctg gtgcgtaccg ggttgagaag cggtgfcaagt gaactgcagt tgccatgttt 1920 

tacggcagtg agagcagaga tagcgctgat gtccggcggt gcttttgccg ttacgcacca 1980 

ccccgbcagt agctgaacag gagggacagc tgatagacac agaagccact ggagcacctc 2040 

aaaaacacca tcatacacta aatcagtaag ttggcagcat cacccataat tgtggtttca 2100 

aaatcggctc cgtcgatact atgfctatacg ccaactttga aaacaacttt gaaaaagctg 2160 

ttttctggta tttaaggttt tagaatgcaa ggaacagtga attggagttc gtcttgttat 2220 

aattagcttc ttggggtatc tttaaatact gtagaaaaga ggaaggaaat aataaatggc 2280 

taaaatgaga atatcaccgg aattgaaaaa actgatcgaa aaataccgct gcgtaaaaga 2340 



WO 2004/063358 PCT/EP2004/000100 
172/358 

tacggaagga atgtctcctg ctaaggtata taagctggtg ggagaaaatg aaaacctata 2400 

tttaaaaatg acggacagcc ggtataaagg gaccacctat gatgtggaac gggaaaagga 2460 

catgatgcta tggctggaag gaaagctgcc tgttccaaag gtcctgcacfc ttgaacggca 2520 

tgatggctgg agcaatctgc tcatgagtga ggccgatggc gtcctttgct cggaagagta 2580 

tgaagatgaa caaagccctg aaaagafctat cgagchgtat gcggagtgca tcaggctcfct 2640 

tcactccatc gacatatcgg attgtcccta tacgaatagc ttagacagcc gcttagccga 2700 

attggattac ttactgaata acgatctggc cgatgtggat tgcgaaaact gggaagaaga 2760 

cactccattt aaagatccgc gcgagctgta fcgatttttta aagacggaaa agcccgaaga 2820 

ggaacttgfcc ttttcccacg gcgacctggg agacagcaac atctttgtga aagatggcaa 2 880 

agtaagtggc tttattgatc ttgggagaag cggcagggcg gacaagtggt atgacattgc 2940 

cttctgogtc cggfccgatca gggaggatat cggggaagaa oagfcat-.gfctig agntatfcttfc 3000 

tgacttactg gggatcaagc ctgattggga gaaaataaaa tattatattt tactggatga 3060 

attgttttag tacctagatg tggcgcaacg atgccggcga caagcaggag cgcaccgact 3120 

tcttccgcat caagtgtttt ggctctcagg ccgaggccca cggcaagtat ttgggcaagg 3180 

ggtcgctggfc attcgtgcag ggcaagattc ggaataccaa gtacgagaag gacggccaga 3240 

cggtctacgg gaccgacttc attgccgata aggtggatta tctggacacc aaggcaccag 3300 

gcgggtcaaa tcaggaataa gggcacattg ccccggcgtg agtcggggca atcccgcaag 3360 

gcigggtgaafc gaatcggacg fcttgaccgga aggcatacag gcaagaantg atogaagagg 3420 

ggttttccgc cgaggatgcc gaaaccatcg caagccgcac cgtcatgcgt gcgccccgcg 3480 

aaaccttcca gtccgtcggc tcgatggtcc agcaagctac ggccaagatc gagcgcgaca 3540 
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gcgtgcaact ggctccccct gccatgcccg cgccatcggc cgccgtggag cgttcgcgtc 3600 

gtctcgaaca ggaggcggca ggtttggcga agtcgatgac catcgacacg cgaggaacta 3660 

tgacgaccaa gaagcgaaaa accgccggcg aggacctggc aaaacaggtc agcgaggcca 372 0 

agcaggccgc gttgctgaaa cacacgaagc agcagatcaa ggaaatgcag ctttccttgt 3780 

fcagaf-.3t-.tgc gccgtggccg gacacgatgc gagcgatgcc aaacgacacg gcccgctctg 3840 

ccctgttcac cacgcgcaac aagaaaatcc cgcgcgaggc gctgcaaaac aaggtcattt 3900 

tccacgtcaa caaggacgtg aagatcacct acaccggcgt cgagctgcgg gccgacgatg 3960 

acgaactggt gtggcagcag gtgttggagt acgcgaagcg cacccctatc ggcgagccga 4020 

tcaccttcac gttctacgag ctttgccagg acctgggctg gt'cgatcaat ggccggtatt 4080 

acacgaaggc cgaggaatgc ctgtcgcgcc tacaggcgac ggcgatgggc ttcacgtccg 4140 

accgcgttgg gcacctggaa tcggtgtcgc tgctgcaccg cttccgcgtc ctggaccgtg 4200 

goaagaaaao gtcaagfctgc oaggtcnhga tcgacgagga aatcgtcgtg ctgtttgctg 4260 

gcgaccacta cacgaaattc atatgggaga agtaccgcaa gctgtcgccg acggcccgac 4320 

ggatgttcga ctatttcagc tcgcaccggg agccgtaccc gctcaagctg gaaaccttcc 4380 

■ gcctcatgtg cggatcggat tccacccgcg tgaagaagtg gcgcgagcag gtcggcgaag 4440 

cctgcgaaga gttgcgaggc agcggcctgg tggaacacgc ctgggtcaat gatgacctgg 4500 

tgcattgcaa acgctagggc cttgtggggt cagttccggc tgggggttca gcagccagcg 4560 

cttfcactggc atttcaggaa caagcgggca ctgctcgacg cacttgcttc gctcagtatc 4620 

gctcgggctcg cacggcgCgc tctaogaaot googataaac agaggafctaa aattgacaat 4680 

tgtgattaag gctcagattc gacggcttgg agcggccgac gtgcaggatt tccgcgagat 4740 

ccgattgtcg gccctgaaga aagctccaga gatgttcggg tccgttfcacg agcacgagga 4800 
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gaaaaagccc atggaggcgfc togctgaacg gttgcgagat gccgtggcat tcggcgccta 4860 

catcgacggc gagatcattg ggctgtcggt cttcaaacag gaggacggcc ccaaggacgc 4920 

tcacaaggcg catctgtccg gcgfctttcgt ggagcccgaa cagcgaggcc gaggggtcgc 4980 

cggtatgctg ctgcgggcgt tgccggcggg tttattgctc gtgatgatcg tccgacagat 5040 

tccaaccracra atctacrtgga tgcgcatctt catcctcggc gcacttaata tttcgctatt 5100 

ctggagcttg ttgtttattt cggtctaccg cctgccgggc ggggtcgcgg cgacggtagg 5160 

cgctgtgcag ccgctgatgg tcgtgttcat ctctgccgct ctgctaggta gcccgatacg 5220 

ahtgatggcg gtcctggggg ctatttgcgg aactgcgggc gtggcgctgt tggtgttgac 5280 

accaaacgca gcgctagatc ctgtcggcgt cgcagcgggc ctggcggggg cggtttccat 5340 

ggcgttcgga accgtgctga cccgcaagtg gcaacctccc gtgcctctgc tcaoctttac 5400 

cgccfcggcaa ctggcggccg gaggacttct gctcgttcca gtagctttag tgtttgabcc 5460 

gccaatcccg atgcctacag gasnnaafcgfc fcctcggccta gcgfcggctcg gcctgatcgg 5520 

agcgggttta acctacttcc tttggtfcccg ggggatctcg cgactcgaac ctacagttgt 5580 

ttccttactg ggctttctca gccccagatc tggggtcgat cagccgggga tgcatcaggc 5640 

cgacagtcgg aacttcgggt ccccgacctg taccattcgg tgagcaatgg ataggggagt 5700 

tgatatcgtc aacgttcact tctaaagaaa tagcgccact cagcttcctc agcggcfctta 5760 

tccagcgatt tcctattatg tcggcatagt tctcaagatc gacagcctgt cacggttaag 5820 

cgagaaatga ataagaaggc tgafcaattcg gatctctgcg agggagatga fcatttgatca 5880 

caggcagcaa cgcfccfcgtca tcgttacaat oaaoatgota ccctccgcga gatcatccgt 5940 

gtttcaaacc cggcagctta gttgccgttc ttccgaatag catcggtaac atgagcaaag 6000 

tctgccgcct tacaacggct ctcccgctga cgccgtcccg gactgatggg ctgcctg'tat 6060 
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cgagtggtga ttttgfcgccg agctgccggt cggggagctg ttggctggct ggtggcagga 6120 

tatattgtgg tgtaaacaaa ttgacgctta gacaacttaa taacacattg cggacgtttt 6180 

taatgtactg gggtggtttt tcttxtcacc agtgagacgg gcaacagctg attgcccttc 6240 

accgcctggc ccfcgagagag ttgcagcaag cggtccacgc tggtttgccc cagcaggcga 6300 

aaatcctgtt tgatggfcggt tccgaaatcg gcaaaatccc ttataaatca aaagaatagc 6360 

ccgagatagg gfctgagtgtt gttccagttt ggaacaagag tccactatta aagaacgtgg 642 0 

actccaacgt caaagggcga aaaaccgtct atcagggcga tggcccacta cgtgaaccat 6480 

cacccaaatc aagttttttg gggtcgaggt gccgtaaagc actaaatcgg aaccctaaag 6540 

ggagcccccg atttagagct tgacggggaa agccggcgaa cgtggcgaga aaggaaggga 6600 

agaaagcgaa aggagcgggc gccattcagg ctgcgcaact gfctgggaagg gcgatcggtg 6660 

cgggcctctt ogctattacg ccagctggcg aaagggggat gtgctgcaag gcgattaagt 672 0 

tgggtaacgc cagggttttc ccagtcacga cgttgtaaaa cgacggccag tgaatbcgag 6780 

ctcggtaccc ggggatcttt cgacacfcgaa atacgtcgag cctgctccgc ttggaagcgg 6840 

cgaggagcct egtcctgfcca coactaccoa catggagtac gcstetctgyyuc agttccgcca 6900 

gctcattaag agccagttca tgggcgttgg catgatggcc gtcatgcatc tgtacttcaa 6960 

gtacaccaac gctcttctga tccagtcgat catccgctga aggcgctttc gaatctggtt 7020 

aagatccacg tcttcgggaa gccagcgact ggtgacctcc agcgtccctt taaggctgcc 7080 

aacagctttc tcagccaggg ccagcccaag accgacaagg cctccctcca gaacgccgag 7140 

aagaactgga ggggtggtgt caaggaggag taagctcctt attgaagtcg gaggacggag 7200 

cggfcgtcaag aggatattct tcgactctgt attatagata agatgatgag gaattggagg 7260 

tagcatagct tcatttggat ttgctttcca ggctgagact ctagcttgga gcatagaggg 7320 
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tcctttggct ttcaatattc tcaagtatct cgagtttgaa cttattccct gfcgaaccttt 7380 

tattcaccaa tgagcattgg aatgaacatg aatctgagga ctgcaatcgc catgaggttt 7440 

tcgaaataca tccggatgtc gaaggcttgg ggcacctgcg ttggttgaat ttagaacgtg 7500 

gcactattga tcatccgata gctctgcaaa gggcgttgca caatgcaagt caaacgfctgc 7560 

tagcagttcc aggtggaatg ttatgatgag cattgtatta aatcaggaga tatagcatga 7620 

tctctagtta gctcaccaca aaagtcagac ggcgtaacca aaagtcacac aacacaagct 7680 

gtaaggattt cggcacggct acggaagacg gagacigcccic uLLceiytyya. uLuyaytacc 7740 

atttaattct atttgtgttt gatcgagacc taatacagcc cctacaacga ccatcaaagt 7800 

ogfcatagcta ccagtgagga agtggactca aatcgacttc agcaacatct ccfcggataaa 7 860 

ctttaagcct aaactataca gaataagata ggtggagagc ttataccgag ctcccaaatc 7920 

tgtccagatc atggttgacc ggtgcctgga tcttcctata gaatcatcct tattcgttga 7980 

cctagctgat tctggagtga cccagagggt catgacttga gcctaaaatc cgccgcctcc 8040 

accatttgta gaaaaatgtg acgaactcgt gagctctgta cagtgaccgg tgactcttte 8100 

tggcatgcgg agagacggac ggacgcagag agaagggctg agtaataagc cactggccag 8160 

acagctctgg cggctctgag gtgcagtgga tgattattaa tccgggaccg gccgcccctc 8220 

cgccccgaag tggaaaggct ggtgtgcccc tcgttgacca agaatctatt gcatcatcgg 8280 

agaatatgga gcttcatcga atcaccggca gtaagcgaag gagaatgtga agccaggggt 8340 

gtatagccgt cggcgaaata gcatgccatt aacctaggta cagaagtcca attgcttccg 8400 

atctggtaaa agattcacga gatagtacct tctccgaagt aggtagagcg agtacccggc 8460 

gcgtaagctc cchaattggc ccatccggca tctgtagggc gtccaaatat cgtgcctctc 8520 

ctgctttgcc cggtgtatga aaccggaaag gccgctcagg agctggccag cggcgcagac 8580 
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cgggaacaca agctggcagt cgacccafccc ggtgctctgc actcgacctg ctgaggtccc 8640 

tcagtccctg gtaggcagct ttgccccgtc tgtccgcccg gtgtgtcggc ggggttgaca 8700 

aggtcgttgc gtcagtccaa catttgttgc catafcttfccc tgctctcccc accagctgct 8760 

cttttctttt ctctttcttt tcccatcttc agtatattca tcttcccatc caagaacctt 8820 

tatttcccct aagtaagtac tttgctacat ccatactcca tcctfccccat cccttattcc 8880 

tttgaacctt tcagttcgag ctttcccacfc tcatcgcagc ttgactaaca gctaccccgc 8940 

ttgagcagac atcaccatgc ctgaactcac cgcgacgtct gtcgagaagt ttctgatcga 9000 

aaagfctcgac agcgtctccg acctgatgca gctctcggag ggcgaagaafc ctcgtgcttt 9060 

cagcttcgat gtaggagggc gtggatatgt cctgcgggta aatagctgcg ccgatggttt 9120 

ctacaaagat cgttatgttt atcggcaett tgcatcggcc gcgctcccga ttccggaagt 9180 

gcttgacatt ggggaattca gegagagcct gacctattgc atctcccgcc gfcgcacaggg 9240 

tgtcacgttg caagacctgc ctgaaaccga actgcccgct gttctgcagc cggtcgcgga 9300 

ggccatggat gcgatcgctg cggccgatct tagccagacg agcgggttcg gcccattcgg 9360 

accgcaagga atcggtcaat acactacatg gcgtgatttc atatgcgcga ttgctgatcc 9420 

ccatgtgtat cactggcaaa ctgtgatgga cgacaccgtc agtgcgtccg tcgcgcaggc 9480 

tctcgatgag ctgatgcttt gggccgagga ctgccccgaa gtccggcacc tcgtgcacgc 9540 

ggatttcgga tccaacaatg tcctgacgga caatggccgc ataacagcgg tcattgactg 9600 

gagcgaggcg atgttcgggg attcccaata cgaggtcgcc aacatcttct tctggaggcc 9660 

gtggttggct tgtatggagc agcagacgcg ctacttcgag cggaggcatc cggagcttgc 9720 

aggatcgccg cggctccggg cgtatatgct ccgcatfcggt cttgaccaac tctafccagag 9780 

cttggttgac ggcaatttcg atgatgcagc ttgggcgcag ggtcgatgcg acgcaatcgt 9840 
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ccgatccgga gccgggactg tcgggcgtac acaaatcgcc cgcagaagcg cggccgtctg 9900 

gaccgatggc tgtgfcagaag tacbcgccga tagtggaaac cgacgcccca gcactcgtcc 9960 

gagggcaaag gaatagagta gatgccgacc gcgggatcga tccacttaac gttactgaaa 10020 

tcatcaaaca gcttgacgaa tctggatata agatcgttgg tgtcgatgtc agctccggag 10080 

ttgagacaaa tggtgttcag gatctcgata agatacgttc atttgfcccaa gcagcaaaga 10140 

gtgccttcta gtgatttaat agctccatgt caacaagaat aaaacgcgtt ttcgggttta 10200 

CCtcttccag atacagctca tctgcaatgu ctLtciaLg(_;u.L Lya.cLgctictc cLagt,<s<acgc 1O2G0 

cttncaggct ccggcgaaga gaagaatagc ttagcagagc tattttcatt ttcgggagac 10320 

gagatcaagc agatcaacgg tcgtcaagag acctacgaga ctgaggaatc cgctcttggc 10380 

tccacgcgac batatatttg tctctaattg tactttgaca tgctcctctt ctttactetg 10440 

afcagcttgac tatgaaaatt ccgtcaccag cncctgggtt cgcaaagaha attgcatgtt 10500 

tcttccttga actctcaagc ctacaggaca cacattcatc gtaggtataa acctcgaaat 10560 

canttcctac taagatggta tacaatagta accatgcatg gttgcctagt gaatgctccg 10620 

taacacccaa tacgccggcc gaaacttttt tacaactctc ctatgagtcg tttacccaga 10680 

atgcacaggt acacttgttt agaggtaatc cttctttcta gctagaagtc ctcgtgtact 10740 

gtgtaagcgc ccactccaca tctccactcg acctgcaggc atgcaagctt ttttcgagtt 10800 

ttttttfcttt ttctttgtga aggatttatt gttattggta 'tccatttttt attggaagac 10860 

aagataagtfc aatattgafct tfcgcttaaag attaaaagga aatoagaaaa ogaoaataaa 10920 

aaatgtaacg gacaaactat ggtgtcgatt ataagtctaa atccttaaaa aatgacaacg 10980 

agttgctttc ctctgaaaac aattcttttg tctttgcaag aaaggtfctct tttttgtttg 11040 
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cttgcattac ttaaacatca aatcaaatga aaggaataaa gcagatttga gggcgaataa 11100 
ggattttctg gtcaacaaga tgtgagtgac acctaaggaa ctaaatgcca ttcatttgtt 11160 
ttaaaacgac atcaaagatt gatgatcaac aggattgaga gagagaaaaa gaactcgtgt 11220 
catttatttc tgttgactga aattttatat ttagaaaaaa tgtcaaatct atagctttag 11280 
ctatattaca taacatttga aataataata ataaaaaaag acacattaga gacacttttc 11340 
aaactctaaa taactgfccta taaacacaaa gaaaacaaag acctctataa caacttatta 11400 
gatttttctc gtacttttgt ctaaagatga tgtattcttg ttatcccaca cttctttcat 11460 
ttgttcttga tgctactaaa fcatacaaaat ttcttttttg caagagatat tattccaaaa 11520 
attttcaaaa agaaattttt ttcacaatag cagttgatcg tgtaacccaa agaggttctt 11580 
tgttattttg cacttccgct ttgcggtgat gcatattcaa agtaatatat ggaataaaca 11640 
acgtgtttaa gcatgaaaga aaggaaacaa aggccgcttt gaacaaatgc ataatatttc 11700 
agrarmaaaafc gatctaaagc aagcagtaaa tcaaacaaga aacattgctg attcgogtta 11760 
gaaaacgata aaagtctaat aagccactaa gtatacttca atgaactttt tgtatgctta 11820 
tggtccaatc agaccaataa tttgtgacca ttcctgaggt ggctttggtg atgcggaaac 11880 
agaaaaaaat tttctcacca atcgatttaa aaaacaattt ctgctttgaa ccaaaacfctt 11940 
ttttttctct ttaatcatta actttatcaa gtatgtacct accctcaaag tcctcacfcca 12000 
agcacaatta tgctaacatt gttccacctt ctctttagaa atgttgtgga tttggaatgc 12060 
cctgafccgtt ttcgttaccg tgattggcat ggaagtgatt gcfcgcactgg cacacaaata 12120 
cataabgcao ggctggggtt ggggatg-gcia tetttcacat catgaaccgc gtaaaggtgc 12180 
gtttgaagtt aacgatcttt atgccgtggt ttttgctgca ttatcgatcc tgctgattta 12240 
tctgggcagt acaggaatgt ggccgctcca gtggattggc gcaggtatga cggcgtatgg 12300 
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afctactctat tttatggtgc acgacgggct ggtgcatcaa cgttggccat tccgctatat 12360 

tccacgcaag ggctaccfcca aacggttgta tatggcgcac cgtatgcatc acgccgtcag 12420 

gggcaaagaa ggttgtgttt cttttggctt cctctatgcg ccgcccctgt caaaacttca 12480 

ggcgacgctc cgggaaagac atggcgctag agcgggcgct gccagagatg cgcagggcgg 12540 

ggaggatgag cccgcatccg ggaagtaagg gcctgaccag aggcggccag cagcagcgtt 12600 

aatttttcgg gcgbggtcgt tgacfcgccgc tgatcccaaa gcttggcgta atcatggtca 12660 

tagctgtttc ctgtgtgaaa ttgttatccg ctcacaattc cacacaacat acgagccgga 12720 

agcataaagt gtaaagcctg gggtgcctaa tgagbgagct aactcacatt aattgcgttg 12780 

cgctcactgc ccgctttcca gtcgggaaac ctgtcgtgcc agctgcatta atgaatcggc 12840 

caacgcgcgg ggagaggcgg tfctgcgtatt gggccaaaga caaaagggcg acattcaacc 12900 

gattgaggga gggaaggtaa atattgacgg aaattattca ttaaaggtga attatcaccg 12960 

taaccgaott gageeat-.tt-.g ggaafetagag ccagcaaaat caccagtagc accattacca 13020 

ttagcaaggc cggaaacgtc accaatgaaa ccatcgatag cagcaccgta atcagtagcg 13080 

acagaatcaa gtttgccttt agcgtcagac tgtagogcgt tttcatcggc attttcggtc 13140 

atagccccct tattagcgtt tgccatcttt tcataatcaa aatcaccgga accagagcca 13200 

ccaccggaac cgcctccctc agagccgcca ccctcagaac cgccaccctc agagccacca 13260 

ccctcagagc cgccaccaga accaccacca gagccgccgc cagcattgac aggaggcccg 13320 

atctagtaac atagatgaca ccgcgcgcga taatttatcc tagtttgcgc gctatatttt 13380 

gfctttcfcatc gcgfcatfcaaa. tgtsfcaatfcg cgggacfcota ateataaaaa occatctciat 13440 

aaataacgtc atgcattaca tgttaattat tacatgcfcta acgtaattca acagaaatta 13500 

tatgataatc atcgcaagac cggcaacagg attcaatctt aagaaacttt attgccaaat 13560 
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gtttgaacga tcggggatca tccgggtctg tggcgggaac tccacgaaaa tatccgaacg 13620 

cagcaagata tcgcggfcgca tctcggtctt gcctgggcag tcgccgccga cgccgttgat 13680 

gtggacgccg ggcccgatca tattgtcgct caggatcgtg gcgttgtgct tgtcggccgt 13740 

tgcfcgtcgta atgatatcgg caccttcgac cgccfcgttcc gcagagatcc cgfcgggcgaa 13 800 

craactccacjc atgagatccc cgcgctggag gatcatccag ccggcgtccc ggaaaacgat 13860 

tccgaagccc aaccbttcat agaaggcggc ggtggaatcg aaatctcgtg atggcaggtt 13920 

gggcgtcgct tggtcggtca tttcgaaccc cagagtcccg ctcagaagaa ctcgtcaaga 13980 

aggcgataga aggcgatgcg ctgcgaatcg ggagcggcga taccgtaaag cacgaggaag 14040 

cggtcagccc attcgccgcc aagctcttca gcaatatcac gggtagccaa cgctatgfccc 14100 

tgatagcggt ccgccacacc cagccggcca cagtcgatga atccagaaaa gcggccattt 14160 

tccaccatga tattcggcaa gcaggcatcg ccatgggtca cgacgagatc atcgccgfccg 14220 

ggcatgcgcg ccttgagr.cifc ggcgaacagt tcggctgcrccr ccraqcccctcj atgctcttcg 14280 

tccagatcat cctgatcgac aagaccggct tccatccgag tacgtgctcg ctcgatgcga 14340 

tgtttcgctt ggtggtcgaa tgggcaggta gccggatcaa gcgtatgcag ccgccgcatt 14400 

gcatcagcca tgatggatac tttcfccggca ggagcaaggt gagatgacag gagatcctgc 14460 

cccggcactt cgcccaatag cagccagtcc cttcccgctt cagtgacaac gtcgagcaca 14520 

gctgcgcaag gaacgcccgt cgtggccagc cacgatagcc gcgctgcctc gtcctgcagt 14580 

tcattcaggg caccggacag gtcggtcttg acaaaaagaa ccgggcgccc ctgcgctgac 14640 

agccggaaca cggcggcate agagcagccg attgtcfcgtt gtgcccagtc atagccgaat 14700 

agcctctcca cccaagcggc cggagaacct gcgfcgcaatc catcttgttc aatcatgcga 14760 

aacgatccag atccggtgca gatfeatttgg attgagagtg aatatgagac tctaattgga 14820 
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taccgagggg aattfcatgga acgtcagtgg agcatttttg acaagaaafca tttgctagct 14880 
gatagtgacc ttaggcgact tttgaacgcg caataatggt ttctgacgta tgtgcfctagc 14940 
tcattaaact ccagaaaccc gcggctgagt ggctccttca acgttgcggfc tctgtcagtt 15000 
ccaaacgtaa aacggcttgt cccgcgtcat cggcgggggt cataacgtga ctcccttaat 15060 
tctccgctca tgatcagatt gtcgtttccc gccttcagtt fcaaactatca gtgtttgaca 15120 
ggatatattg gcgggtaaac ctaagagaaa agagcgttta ttagaataat cggatattta 15180 
aaagggcgtg aaaaggttta tccgLLegtc cattfcgtatg tgcatgccoa ccaoagggfcfe 15240 
ccccagatct ggcgccggcc agcgagacga gcaagattgg ccgccgcccg aaacgatccg 153 00 
acagcgcgcc cagcacaggt gcgcaggcaa attgcaccaa cgcatacagc gccagcagaa 15360 
tgccatagtg ggcggtgacg tcgttcgagt gaaccagatc gcgcaggagg cccggcagca 15420 
ccggcataat caggccgatg ccgacagcgt cgagcgcgac agtgctcaga attacgatca 15480 
ggggtatgtt gggtttcacg tctggcctcc ggaccagcct ccgctggtcc gattgaacgc 15540 
gcggattctt tatcactgat aagttggtgg acatattatg tttatcagtg ataaagtgtc 15600 
aagcatgaca aagttgcagc cgaatacagt gatccgtgcc gccctggacc tgttgaacga 15660 
ggtcggcgta gacggtctga cgacacgcaa actggcggaa cggttggggg ttaagcagcc 15720 
ggcgctttac tggcacttca ggaacaagcg ggcgctgctc gacgcactgg ccgaagccat 15780 
gctggcggag aatcatacgc attcggtgcc gagagccgac gacgacfcggc gctcatttct 15840 
gatcgggaat gcccgcagct tcaggcaggc gctgctcgcc taccgcgatg gcgcgcgcat 15900 
ccatgccggc acgcgaccgg gcgcaccgca gatggaaacg gccgacgcgc agcttcgctt 15960 
cctctgcgag gcgggttttt cggccgggga cgccgtcaat gcgctgatga caatcagcta 15020 
cttcactgtt ggggccgtgc ttgaggagca ggccggcgac agcgatgccg gcgagcgcgg 16080 
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cggcaccgtt gaacaggctc cgctctcgcc gntgttgcgg gccgcgatag acgccfctcga 16140 
cgaagccggt ccggacgcag cgfctcgagca gggacfccgcg gtgattgtcg atggattggc 
gaaaaggagg ctcgttgfcca ggaacgttga aggaccgaga aagggtgacg attgatcagg 162 
accgctgccg gagcgcaacc cactcactac agcagagcca tgtagacaac afccccctccc 
cctttccacc gcgtcagacg cccgtagcag cccgctacgg gctttttcat gccctgccct 
agcgtccaag cctcacggcc gcgctcggcc tctctggcgg ccttctggcg ctcttccgct 16440 
tCCtcgctca ctgactcgct gugctcggbc gttcggctgc ggcgagaggfc atoagotcac 1650 0 
tcaaaggcgg taatacggtt atccacagaa tcaggggata acgcaggaaa gaacatgtga 16560 
gcaaaaggcc agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc gtttttccat 
aggctccgcc cccctgacga gcatcacaaa aatcgacgct caagtcagag gtggcgaaac 
ccgaeaggac tataaagata ccaggcgttt ccccctggaa gctccctcgt gcgctctcct 16740 
gttccgaccc tgccgcttac cggatacctg tccgcctttc tcccttcggg aagcgtggcg 16800 
cttttccgct gcataaccct gcttcggggt cattafcagcg attttttcgg tatatccatc 16860 
ctttttcgca cgatatacag gattttgcca aagggttcgt ytagactttc cttggtgfcat_ 16920 
ccaacggcgt cagccgggca ggataggtga agtaggccca cccgcgagcg ggtgttcctt 16980 
cttcactgtc ccttattcgc acctggcggt gctcaacggg aatcctgctc tgcgaggctg 17 
gccggctacc gccggcgtaa cagatgaggg caagcggatg gctgatgaaa ccaagccaac 
caggaagggc agcccaccta tcaaggtgta ctgccttcca gacgaacgaa gagcgattga 17160 
ggaaaaggcg gcggcggccg gcatgagcct gtcggcctac ctgctggccg tcggccaggg 17220 
ctacaaaatc acgggcgtcg tggactatga gcacgtccgc gagctggccc gcatcaatgg 17280 
cgacctgggc cgcctgggcg gcctgctgaa actctggctc accgacgacc cgcgcacggc 17340 
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gcggttcggt gatgccacga tcctcgccct gctggegaag atcgaagaga agcaggacga 
gcttggcaag gtcatgatgg gcgtggtccg cccgagggca gagccatgac ttttttagcc 
gctaaaacgg ccggggggtg cgcgtgattg ccaagcacgt ccccatgcgc tccatcaaga 
agagcgactt cgcggagctg gtgaagtaca tcaccgacga gcaaggcaag accgagcgcc 
tttgcgacgc tea 



<210> 43 

<21X> 16954 

<2X2> DNA 

<213> Artificial 

<220> 

<223> Plasmid 



<220> 

<222> (10264) .. (10264) 
<223> n is a, c, g, or t 

<220> 

<221> misc_feature 

<222> (10472) (10472) 

<223> n is a, c, g, or t 

<220> 

<221> misc_feature 

<222> (10563) .- (10563) 

<223> n is a, c, g, or t 

<400^ 43 . 

ccgggctggt tgccctcgcc gctgggctgg cggccgtcta tggccctgca aacgcgccag 
aaacgccgtc gaagccgtgt gcgagacacc gcggccgccg gcgttgtgga tacctcgcgg 
aaaacttggc cctcactgac agatgagggg cggacgttga cacttgaggg gccgactcac 
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ccggcgcggc gttgacagat gaggggcagg ctcgatttcg gccggcgacg tggagctggc 240 

cagcctcgca aatcggcgaa aacgcctgat tttacgcgag tttcccacag atgatgtgga 300 

caagcctggg gataagtgcc ctgcggtatt gacacttgag gggcgcgact actgacagat 360 

gaggggcgcg atccttgaca cttgaggggc agagtgctga cagatgaggg gcgcacctat 420 

tgacatttga ggggctgtcc acaggcagaa aatccagcat ttgcaagggt ttccgcccgt 480 

fctttcggcca ccgctaacct gtcttttaac ctgcttttaa accaatattt ataaaccttg 540 

tttttaacca gggctgcgcc ctgtgcgcgt goccgcgcac gaagaagggg ggfcgoccddc 600 

cttctcgaac cctcccggcc cgctaacgcg ggcctcccat ccccccaggg gctgcgcccc 660 

bcggccgcga acggcctcac cccaaaaatg gcagcgctgg cagtccttgc catfcgccggg 720 

atcggggcag taacgggatg ggcgatcagc ccgagcgcga cgcccggaag cattgacgtg 780 

ccgcaggtgc tggcatcgac attcagcgac caggtgccgg gcagtgaggg cggcggcctg 840 

ggtggcggcc tgcccttcac ttcggccgtc ggggcattca cggacttcat ggcggggccg 900 

gcaattttta ccttgggcat tcttggcata gtggtcgcgg gtgccgtgct cgtgttcggg 960 

ggtgcgataa acccagcgaa ccatttgagg tgataggt-aa. g^ttataccg aggtatgaaa 102 0 

acgagaattg gacctttaca gaattactct atgaagcgcc atatttaaaa agctaccaag 1080 

acgaagagga bgaagaggat gaggaggcag attgccttga atatattgac aatactgata 1140 

agataatata tcttttafcat agaagatatc gccgtatgta aggatttcag ggggcaaggc 1200 

ataggcagcg cgcttatcaa tatatctata gaatgggcaa agcataaaaa cttgcatgga 1260 

ctaatgcttg aaacccagga caataacctt atagcttgta aattctatca taattgggta 1320 

atgactccaa cttattgata gtgttttatg ttcagataat gcccgatgac tttgtcatgc 1380 

agctccaccg attttgagaa cgacagcgac ttccgtccca gccgtgccag gtgctg^tt; 1440 
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agattcaggt tatgccgctc aatfccgctgc gtatatcgct tgctgattac gfcgcagcttt 1500 

cccttcaggc gggattcata cagcggccag ccatccgtca tccatatcac cacgtcaaag 1560 

ggtgacagca ggctcataag acgccccagc gtcgccatag tgcgttcacc gaatacgtgc 1620 

gcaacaaccg tctfcccggag actgtcatac gcgtaaaaca gccagcgctg gcgcgattta 1680 

gccccgacat agccccactg ttcgtccatt tccgcgcaga cgatgacgtc actgcccggc 1740 

tgtatgcgcg aggttaccga ctgcggcctg agttfctttaa gtgacgtaaa atcgtgttga 1800 

ggccaacgcu uatctctLycgg gctgttgccc ggcatccaac gccatfcaea.bg gaaatatcaa 1860 

tgattttctg gtgcgtaccg ggttgagaag cggtgtaagt gaactgcagt tgccatgttt 1920 

tacggcagtg agagcagaga tagcgctgat gtccggcggt gcttttgccg ttacgcacca 1980 

ccccgtcagt agctgaacag gagggacagc tgabagacac agaagccact ggagcacctc 2040 

aaaaacacca tcatacacta aatcagtaag ttggcagcat cacccataat tgtggtttca 2100 

aaatcggctc cgtcgatact atgttatacg ccaactttga aaacaacttt gaaaaagctg 2160 

ttttctggta tttaaggttt tagaatgcaa ggaacagtga attggagttc gtcttgttat 2220 

aattagcttC ttggggtatc tttaaatact gtagaaaaga. ga<*ctggaa.cit aataaatggc 2200 

taaaatgaga atatcaccgg aattgaaaaa actgatcgaa aaataccgct gcgfcaaaaga 2340 

tacggaagga afcgtctcctg cfcaaggtata taagctggtg ggagaaaatg aaaacctata 2400 

tttaaaaatg acggacagcc ggtataaagg gaccacctat gatgtggaac gggaaaagga 2460 

catgatgcta tggctggaag gaaagcfcgcc tgttccaaag gtcctgcact ttgaacggca 2520 

tgatggctgg agcaatctgc tcatgagtga ggccgatggc gtcctttgct cggaagagta 2580 

tgaagatgaa caaagccctg aaaagattat cgagctgtat gcggagtgca tcaggctctt 2640 

tcactccatc gacatatcgg attgtcccta tacgaatagc ttagacagcc gcttagccga 27 oo 



WO 2004/063358 PCT/EP2004/000100 
187/358 

attggattac ■ ttactgaata acgatctggc cgatgtggat tgcgaaaact gggaagaaga 2760 

cactccattt aaagatccgc gcgagctgta tgatfctttta aagacggaaa agcccgaaga 2820 

ggaactfcgtc ttttcccacg gcgacctggg agacagcaac atctttgtga aagatggcaa 2880 

agtaagtggc tttattgatc ttgggagaag cggcagggcg gacaagtggt atgacattgc 2940 

cttctgcgtc cggtcgatca gggaggatat cggggaagaa cagtatgtcg agctattttt 3000 

tgacttactg gggatcaagc ctgattggga gaaaataaaa tattatattt fcactggatga 3060 

attgttttag tacctagatg tggcgcaacg etLgceggcget caagcaggag cgcaccgetct 3120 

tcttccgcat caagtgtttt ggctctcagg ccgaggccca eggcaagtat fctgggcaagg 3180 

ggtcgctggfc attcgtgcag ggcaagattc ggaataccaa gtacgagaag gacggccaga 3240 

cggtctacgg gaccgacttc attgccgata aggtggatta tctggacacc aaggcaccag 3300 

gcgggtcaaa tcaggaataa gggcacattg ccccggcgtg agtcggggca atcccgcaag 3360 

gagggtgaat gaatcggacg tttgaccgga aggcatacag gcaagaactg atcgacgcgg 3420 

ggttttccgc cgaggatgcc gaaaccatcg caagccgcac cgtcatgcgt gcgccccgcg 3480 

aaaccttcca gtccgtcggc tcgatggtcc agcaagctac ggccaagatc gagcgcgaca 3540 

gcgtgcaact ggctccccct gcccfcgcccg cgccatcggc cgccgtggag cgttcgcgtc 3600 

gtctcgaaca ggaggcggca ggtttggcga agtcgatgac catcgacacg cgaggaacta 3660 

tgacgaccaa gaagcgaaaa accgccggcg aggacctggc aaaacagg'tc agcgaggcca 3720 

agcaggcogc gfctgctgaaa caoaogaago agcagatcaa crg-aaatgcag- efctfccnttcrt 3780 

tcgatattgc gccgtggccg gacacgatgc gagcgatgcc aaacgacacg gcccgctctg 3840 

ccctgttcac cacgcgcaac aagaaaatcc cgcgcgaggc gctgcaaaac aaggtcattt 3900 
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tccacgtcaa caaggacgtg aagatcacct acaccggcgt cgagctgcgg gccgacgatg 3960 
acgaactggt gtggcagcag gtgttggagt acgcgaagcg cacccctatc ggcgagccga 4020 
tcaccttcac gttctacgag ctttgccagg acctgggctg gtcgatcaat ggccggtatt 4080 
acacgaaggc cgaggaatgc ctgtcgcgcc tacaggcgac ggcgatgggc ttcacgtccg 4140 
accgcgttgg gcacctggaa tcggtgtcgc tgcfcgcaccg cttccgcgtc ctggaccgtg 4200 
gcaagaaaac gtcccgttgc caggtcctga tcgacgagga aatcgtcgtg ctgtttgctg 4260 
gcyaccacta ccgoaabtc abatgggag. agtaccgcaa crctgtcgccg acggcccgac 4320 
ggatgttcga ctatttcagc tcgcaccggg agccgtaccc gctcaagctg gaaaccttcc 4380 
gcctcatgtg cggatcggat tccacccgcg tgaagaagtg gcgcgagcag gtcggcgaag 4440 
cctgcgaaga gttgcgaggc agcggcctgg tggaacacgc ctgggtcaat gatgacctgg 4500 
tgcattgcaa acgctagggc cttgtggggt cagttccggc tgggggttca gcagccagcg 4560 
ctttactggc atttcaggaa caagcgggca ctgctcgacg cacttgcttc gctcagtatc 4620 
gctcgggacg cacggogcgc tctacgaact gccgataaac agaggattaa aattgacaat 4680 
tgtgattaag gctcagattc gacggcttgg ageggcogac ghgcaggatt tccacgagat 4740 
ccgattgtcg gccctgaaga aagctccaga gatgttcggg tccgtttacg agcacgagga 4800 
gaaaaagccc atggaggcgt tcgctgaacg gttgcgagat gccgtggcat tcggcgccta 4860 
catcgacggc gagatcattg ggctgtcggt cttcaaacag gaggacggcc ccaaggacgc 4920 
tcacaaggcg catctgtccg gcgttttcgt ggagcccgaa cagcgaggcc gaggggtcgc 4980 
cggtatgcfcg ctgcgggcgt tgccggcggg tttattgctc gtgatgatcg tccgacagat 5040 
tccaacggga atctggtgga tgcgcatctt catcctcggc gcacttaata tttcgctatt 5100 
Ctggagcttg ttgtttattt cggtctaccg cctgacgggc ggggfccgcgg cgacggfc^gg 5160 
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cgctgtgcag ccgctgatgg tcgtgttcat ctctgccgct ctgctaggta gcccgatacg 5220 
attgatggcg gtcctggggg ctatttgcgg aactgcgggc gtggcgctgt tggtgttgac 5280 
accaaacgca gcgctagatc ctgtcggcgt cgcagcgggc ctggcggggg cggttfcccat 5340 
ggcgfctcgga accgtgctga cccgcaagtg gcaacctccc gtgcctctgc taacctttac 5400 
cgcctggcaa ctggcggccg gaggacttct gctcgttcca gtagctttag tgrttgatcc 54S0 
gccaatcccg atgcctacag gaaccaatgt tctcggcctg gcgtggctcg gcctgatcgg 5520 
agcgggttta aceteaetfcec tttflOttcog ggggatctcg cgactcgaac ctacagttgt 5580 
ttccttactg ggctttctca gccccagatc tggggtcgat cagccgggga tgcatcaggc 5640 
cgacagtcgg aacttcgggt ccccgacctg taccattcgg tgagcaatgg ataggggagt 5700 
tgatatcgtc aacgttcact tctaaagaaa tagcgccact cagcttcctc agcggcttta 5760 
tccagcgatt tcctattatg tcggcatagt tctcaagatc gacagcctgt cacggttaag 5820 
cgagaaatga ataagaaggc tgataattcg gatctctgcg agggagatga fcatttgatca 5880 
caggcagcaa cgctctgtca tcgttacaat caacatgcta ccctccgcga gatcatccgt 5940 
B tttcw«cc cggcagctta gttgcogfctc ttccgaatag catcggtaac atgagcaaag 6000 
tctgccgcct tacaacggct ctcccgctga cgccgtcccg gactgatggg ctgcctgfcat 6060 
cgagtggtga ttttgtgccg agctgccggt cggggagctg ttggctggct ggtggcagga 6120 
tatattgtgg tgtaaacaaa ttgacgctta gacaacttaa taacacattg cggacgtttt 6180 
taatgtactg gggtggtttt fcottttcacc agtgagacgg gcaacagctg attgcccttc 6240 
accgcctggc cctgagagag ttgcagcaag cggtccacgc tggtttgccc cagcaggcga 6300 
aaatcctgtt tgatggtggt tccgaaafccg gcaaaatccc ttataaatca aaagaatagc 6360 
ccgagatagg gttgagtgtt gtfcccagtfct ggaa^gaa tccactatta aagaacgtgg 6420 
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actccaacgfc caaagggcga aaaaccgfcct atcagggcga tggcccacta cgtgaaccat 6480 

cacccaaatc aagttttttg gggtcgaggt gccgtaaagc actaaatcgg aaccctaaag 6540 

ggagcccccg atttagagct tgacggggaa agccggcgaa cgtggcgaga aaggaaggga 6600 

. agaaagcgaa aggagcgggc gccattcagg ctgcgcaact gttgggaagg gcgatcggtg 6660 

cgggcctctt cgctattacg ccagctggcg aaagggggat gtgctgcaag gcgattaagt 6720 

tgggtaacgc cagggtbttc ccagtcacga cgttgtaaaa cgacggccag tgaattcgag 6780 

ctcggtaccc ggggahnttfc cgacactgaa atacgtcgag cctgctccgc ttggaagcgg 6840 

cgaggagcct cgtcctgtca caactaccaa catggagtac gataagggcc agttccgcca 6900 

gctcattaag agccagttca tgggcgttgg catgatggcc gfccatgcatc tgtacttcaa 6960 

gtacaccaac gcfccttctga tccagtcgat catccgctga aggcgctttc gaatctggtt 7020 

aagatccacg tcttcgggaa gccagcgact ggtgacctcc agcgtccctt taaggctgcc 7080 

aacagctttc tcagccaggg ccagcccaag accgacaagg cctccctcca gaacgccgag 7140 

aagaactgga gg g g tggtgt caaggaggag taagcfccctt attgaagtcg gaggacggag 7200 

cggtgtcaag aggatabtct tog*ct<^gt attatagata agatgatgag gaattggagg 7260 

tagcatagct tcatttggat ttgctttcca ggctgagact ctagcttgga gcatagaggg 7320 

tcctttggct ttcaatattc tcaagtatct cgagtttgaa otfcattcoct gtga&ccttt 73 80 

tattcaccaa tgagcattgg aatgaacatg aatctgagga ctgcaatcgc catgaggttt 7440 

tcgaaataca tccggafcgtc gaaggcttgg ggcacctgcg ttggttgaat ttagaacgtg 7500 

gcactattga tcatccgata gctctgcaaa gggcgttgca caatgcaagt caaacgttgc 7560 

tagcagttcc aggtggaatg ttatgatgag cattgtatta aatcaggaga tatagcatga 7620 

tctctagtta gctcaccaca aaagtcagac ggcgtaacca aaagtcacac aacacaagct 7680 
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gtaaggattt cggcacggct acggaagacg gagaagccac cttcagtgga ctcgagtacc 7740 
etttpaattct atttgtgfcfcfc gatcgagaco t«ta«ace cctacaacga ccatcaaagt 7800 
cgtatagcta ccagtgagga agtggactca aatcgacttc agcaacatct cctggataaa 7860 
ctttaagcct aaactataca gaataagata. ggtggagagc ttataccgag ctcccaaatc 7920 
tgtccagatc atggttgacc ggtgcctgga tcfctcctata gaatcatcct tattcgttga 7980 
■ cctagctgat tctggagtga cccagagggt catgacttga gcctaaaatc cgccgcctcc 8040 
accatttgta gaaaaatgtg acgaactcgt gagctctgta cagtgaccgg tgactctfctc 8100 
tggcatgcgg agagacggac ggacgcagag agaagggctg agtaataagc cactggccag 8160 
acagctctgg cggctctgag gtgcetgtgg* tgatftt- toogggaong accgcccctc 8220 
cgccccgaag tggaaaggct ggtgtgcccc tcgttgacca agaatctatt gcatcatcgg 8280 
agaatatgga gcttcatcga atcaccggca gtaagcgaag gagaatgtga agccaggggt 8340 
gtatagccgt cggcgaaata gcatgccatt aacctaggta cagaagtcca attgcttccg 8400 
atctggtaaa agattcacga gatagtacct tctccgaagt aggtagagcg agtacccggc 8460 
gcgtaagctc ccfcaattggc ccatccggca tctgtagggc gtccaaatat cgtgcotctc 8520 
ctgctttgcc cggtgtatga aaccggaaag gcogctcagg agctggccag cggcgcagac 8580 
cgggaacaca agctggcagt cgacccatcc ggt y u t ct g c actogaoctg rtgw^ 8640 
tcagtccctg gtaggcagcfc ttgccccgtc tgtccgcccg gtgtgtcggc ggggttgaca 8700 
aggtcattgc gtcagtccaa catttgttgc catattttcc tgctctcccc accagctgct 8760 
cttttctttt ctctttcttt tcccatctfcc agtatattca tcttcccatc caagaacctt 8820 
tatttcccct aagtaagtac tttgctacat coatactcca tccttcccat cccttattcc 8880 
tttgaacctt tcagtfccgag ctttcccact tcatcgcagc ttgactaaca gctaccccgc 8940 



WO 2004/063358 

192/358 



PCT7EP2004/000100 



ttgagcagac atcaccatgc ctgaactcac cgcgacgtct gtcgagaagt ttctgatcga 9000 

aaagttcgac agcgteLccg a cct g atg C a gototcggag ggrgaagaat etootaottt 9060 

cagcttcgat gtaggagggc gtggatatgt cctgcgggta aatagctgcg ccgatggttt 9120 

ctacaaagat cgttatgttt atcggcactt tgcatcggcc gcgctcccga ttccggaagt 9180 

gcttgacatt ggggaattca gcgagagcct gacctattgc atctcccgcc gtgcacaggg 9240 

tgtcacgttg caagacctgc ctgaaaccga actgcccgct gttctgcagc cggtcgcgga 9300 

ggccatggat gcgatcgctg cggccgatct tagccagacg agcgggttcg gcccattcgg 93 60 

accgcaagga atcggtcaat acactacatg gcgtgatttc atatgcgcga ttgctgatcc 9420 

ccatgtgtat cactggcaaa ctgtgatgga ^caccgtc agtgcgtaog togege.ggr, 9480 
tctcgatgag ctgatgcttt gggccgagga ctgccccgaa gtccggcacc tcgtgcacgc ■ 9540 

ggatttcggc tccaacaatg tcctgacgga caatggccgc ataacagcgg tcattgactg 9600 

gagcgaggcg atgttcgggg attcccaata cgaggtcgcc aacatcttct tctggaggcc 9660 

gtggttggct tgtatggagc agcagacgcg ctacttcgag cggaggcatc cggagcttgc 9720 

aggatcgccg cggctccggg cgtatatgct ccgcattggt cttgaccaac tctatcagag 9780 
cttggttgac ggcaatttcg atgatgcagc ttgggcgcag ggtcgatgcg acgcaatcgt 9840 
ccgatccgga gccgggactg tcgggcgtac acaaatcgcc cyc a ga a gcg cggccgtotg 9900 
gaccgatggc tgtgtagaag tactcgccga tagtggaaac cgacgcccca gcactcgtcc 9960 

gagggcaaag gaatagagta gatgccgacc gcgggatcga tccacttaac gttactgaaa 10020 

tcatcaaaca gcttgacgaa tctggatata agatcgttgg tgtcgatgtc agctccggag 10080 
ttgagacaaa tggtgttcag gatctcgata agatacgttc atttgtccaa gcagcaaaga 10140 
gtgccttcta gtgatttaat agctccatgt caacaagaat aaaacgcgtt ttcgggttta 10200 
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cctcttccag atacagctca tctgcaatgc attaatgcat tgactgcaac ctagtaacgc 10260 
cttncaggct ccggcgaag- g«a*oafc«gc twgagc taf.ttteatt ttcaaaagac 10320 
gagatcaagc agatcaacgg tcgtcaagag acctacgaga ctgaggaatc cgctcttggc 10380 
tccacgcgae tatatatttg tetctaattg tactttgaca tgetcetctt ctttactctg 10440 
atagcttgac tatgaaaatt ccgtcaccag cncctgggtt cgcaaagata attgoatgtt 10500 
tcttccttga actctcaagc ctacaggaca cacattcatc gtaggtataa acctcgaaat 10560 
canttcctac taagatggta tacaatagta accatgcatg gttgcctagt gaatgctccg 10620 
taacacccaa tacgccggcc gaaacttttt tacaactctc ctatgagtcg tttacccaga 10680 
atgcacaggt acacttgttt agaggtaatc ctLutttcta gctagaagta otogtgtaet 10740 
gtgtaagcgc ccactccaca tctccactcg acctgcaggc atgcaagctt gagattaaaa 10800 
tagataagga aaagaaagtg aaaagaaatt cggaagcatg gcacattctt ctttttataa 10860 
atacatgcct gactttcttt ttccatcgat atgatatatg catatgatag atatacaagc 10920 
aatcttcttc aaggagtttg aaattttgtc ctccaggagc aaaaaaaagt ttttttttat 10980 
acatgtttgt acacaagaat agttaccaat ttgctttggt cttacgtgct gcaagtttat 11040 
atcgttttca atttctttgt ctttacattt tctttgtcct ttatctttcc tcatttagtc 11100 

tttgggagaa ttaggaaaag ggagcggaaa ggtaagaaat gcttgcgtat tttactaatt 11160 

cggcaaacat ccaatttggc aaacagcagc ctgtgcaacg ctctcgagat gacagtatct 11220 

ttgattacac tctaaatctc gatgacccga ccaaaaagag cgaacaaaga aataatcttg 11280 

tgcattcgaa tatgatggaa gattttttcc cccttattct aaatgttgac atagcgtgta 11340 

tgttatataa acw^ogaa attgta caaa otttetttte ttctcttttt attttatctc 11400 
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tatgttgtgg atttggaatg ccctgatcgt tttcgttacc gtgattggca tggaagtgat 11460 
tgctgcactg gcacacaaat acatcatgca cggctggggt tggggatggc atctttcaca 11520 
tcabgaaccg cgtaaaggtg cgtttgaagt taacgatctt tatgccgtgg tttttgctgc 11580 
attatcgatc ctgctgattt atctgggcag tacaggaatg tggccgctcc agtggattgg 11640 
cgcaggtatg acggcgtatg gattactcta ttttatggtg cacgacgggc tggtgcatca 11700 
acgttggcca ttccgctata ttccacgcaa gggctacctc aaacggttgt atatggcgca 11760 
oogtatgcat c.ngeegtca ggcmcaaaga aggttgtgtt tctthtggct tcctctatgc 1182 0 
gccgcccctg tcaaaacttc aggcgacgct ccgggaaaga catggcgcta gagcgggcgc 11880 
tgccagagat gcgcagggcg gggaggatga gcccgcatcc gggaagtaag ggcctgacca 11940 
gaggcggcca gcagcagcgt taatttttcg ggcgtggtcg ttgactgccg ctgatcccaa 12000 
agcttggcgt aa tcatggtc atagctgttt cctgtgtgaa attgttatcc gctcacaatt 12060 
ccacacaaca tacgagccgg aagcataaag tgtaaagcct ggggtgccta atgagtgagc 121*0 
taactcacat taattgcgtt gcgctcactg cccgctttcc agtcgggaaa cctgtcgtgc 12180 
cagc tgcatt aatgaatcgg ceaangcgcg srcrgacraccscg gtttgcgtat tgggccaaag 12240 
acaaaagggc gacattcaac cgattgaggg agggaaggta aatattgacg gaaattattc 12300 
attaaaggtg aattatcacc gtcaccgact tgagccattt gggaattaga gccagcaaaa 123 60 
tcaccagtag caccattacc attagcaagg ccggaaacgt caccaatgaa accatcgata 12420 
gcagcaccgt aatcagtagc gacagaatca agtttgoctt tagcgtcaga ctgfcagcgcg 12480 
ttttcatcgg cattttcggt catagccccc ttattagcgt ttgccatctt ttcataatca 12540 
aaatcaccgg aaccagagcc accaccggaa ccgcctccct cagagccgcc accctcagaa 12600 
ccgccaccct cagagccaco acootoagag ccgc^ncag aaccaecace agagccgccg 12660 
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ccagcattga caggaggccc gatctagtaa catagatgac accgcgcgcg ataatttatc 12720 
ctagtttgcg cgctatattt tgttttctat cgcgtattaa atgtataatt gcgggactct 12780 
aatcataaaa acccatctca taaataacgt catgcattac atgttaatta ttacatgctt 12840 
aacgtaattc aacagaaatt atatgataat cafccgcaaga ccggcaacag gattcaatct 12900 
taagaaactt tattgccaaa tgtttgaacg atcggggatc atccgggtct gtggcgggaa 129 60 
ctccacgaaa atatccgaac gcagcaagat atcgcggtgc atctcggtct tgcctgggca 13020 
gtcgcogccg aeg^gttga tgtcraacgcc gggcccgatc atattgtcgc tcaggatcgt 13080 
ggcgttgtgc ttgtcggccg ttgctgtcgt aatgatatcg gcaccttcga ccgcctgttc 13140 
cgcagagatc ccgtgggcga agaactccag catgagatcc ccgcgctgga ggafccatcca 13200 
gccggcgtcc cggaaaacga ttccgaagcc caacctttca tagaaggcgg cggtggaatc 13260 
gaaatctogt gatggcaggt tgggcgtcgc ttggtcggtc atttcgaacc ccagagtccc 13320 
gctcagaaga actcgtcaag aaggcgatag aaggcgatgc gctgcgaatc gggagcggcg 1338U 
ataccgtaaa gcacgaggaa gcggtcagcc cattcgccgc caagctcttc agcaatatca 13440 
cgggtagC ca acgotatgtc ctga^gegcr tccgccacac ccagccggcc acagtcgatg 13500 
aatccagaaa agcggccatt ttccaccatg atahtcggca agcaggcatc gccatgggtc 13560 
acgacgagat catcgccgtc gggcatgcgc gccttgagcc tggcgaacag ttcggctggc 13620 
gcgagcccct gatgctcttc gtccagatca tcctgatcga caagaccggc ttccatccga 13680 
gtacgtgctc gctcgatgcg atgtttcgct tggtggtcga atgggcaggt agccggatca 13740 
agcgbatgca gccgccgcat tgcatcagcc atgatggata ctttctcggc aggagcaagg 13800 
tgagatgaca ggagatcctg ccccggnact tcgcccaata gcagccagtc ccttcccgct 138 60 
tcagtgacaa cgtcgagcac agotgogcaa ggaaogcceg fcngtggccag acacgatagc 13920 
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cgcgctgcct cgtcctgcag ttcattcagg gcaccggaca ggtcggtctt gacaaaaaga 13980 
accgggcgcc cctgcgctga cagccggaac acggcggcat cagagcagcc gattgtctgt 14O40 
tgtgcccagt catagccgaa tagcctctcc acccaagcgg ccggagaacc tgcgtgcaat 14100 
ccatcttgtt caatcatgcg aaacgatcca gatccggtgc agattatttg gattgagagt 14160 
gaatatgaga ctctaattgg ataccgaggg gaatttatgg aacgtcagtg gagcattttt 14220 
gacaagaaat atttgctagc tgatagtgac cttaggcgac ttttgaacgc gcaataatgg _ 142 80 
tttctgacgt atgtgcttag ctcattaaac tccagaaacc cgcggctgag tggctccttc 14340 
aacgttgcgg ttctgtcagt tccaaacgta aaacggcttg tcccgcgtca tcggcggggg 14400 
tcataacgtg actcccttaa ttctccgctc atgatcagat tgtcgtttcc cgccttcagt 14460 
ttaaactatc agtgtttgac aggatatatt ggcgggtaaa cctaagagaa aagagcgttt 14520 
abtagaataa tcggatattt aaaagggcgt gaaaaggttt atccgttcgt ccatttgtab 14580 
gtgcatgcca accacagggt tccccagatc tggcgccggc cagcgagacg agcaagattg 14640 
gccgccgccc gaaacgatcc gacagcgcgc ccagcacagg tgcgcaggca aattgcacca 14700 
aogeatacag ngccagcasa atcrccatagt gggcggtgac gtcgttcgag tgaaccagafc 14760 
cgcgcaggag gcccggcagc apcggcataa tcaggccgat gccgacagcg tcgagcgcga 14820 
cagtgctcag aatfcacgatc aggggtatgt tgggtttcac gtctggcctc cggaccagcc 14880 
tccgctggtc cgattgaacg cgcggattct ttatcactga taagttggtg gacatattat 14940 

gtttatcagt gataaagtgt caagcatgac aaagttgcag ccgaatacag tgatccgtgc 15000 

cgccctggac ctgttgaacg aggtcggcgt agacggtctg acgacacgca aactggcgga 15060 

acggttgggg gttcagcagc cggcgcttta ctggcacttc aggaacaagc gggcgctgct 15120 

cgacgcactg gccgaagcca tgctggcgga gaatcatacg cattcggtgc cgagagccga 15180 
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cgacgactgg cgctcatttc tgatcgggaa tgcccgcagc ttcaggcagg cgctgcfccgc 15240 
c taccH c ya t ggcgcgcgca tcaatg^ga cacgccracca ggcgcaccgc agatggaaac 15300 
ggccgacgcg cagcttcgct tcctctgcga ggcgggtttt tcggccgggg acgccgtcaa 15360 
tgcgctgatg acaatcagct acttcactgt tggggccgtg cttgaggagc aggccggcga 15420 
cagcgatgcc ggcgagcgcg gcggcaccgt tgaacaggct ccgcfcctcgc cgctgttgcg 15480 
ggccgcgata gacgccttcg acgaagccgg tccggacgca gcgttcgagc agggactcgc 15540 
ggfcgattgtc gatggattgg cgaaaaggag gotcgttgtc aggaacgttg aaggaccgag 15600 
aaagggtgac gattgatcag gaccgctgcc ggagcgcaac ccactcacta cagcagagcc 15660 
atgtagacaa catcccctcc ccctttccac ogcgtcagac g^.gtaaca crcccgchacg 15720 
ggctttttca tgccctgccc tagcgtccaa gcctcacggc cgcgctcggc ctctctggcg 15780 
gccttctggc gctcttccgc ttcctcgctc actgactcgc tgcgctcggt cgttcggctg 15840 
cggcgagcgg tatcagctca ctcaaaggcg gtaatacggt tatccacaga atcaggggat 15900 
aacgcaggaa agaacatgtg agcaaaaggc cagcaaaagg ccaggaaocg taaaaaggcc 15960 
gcgttgctgg cgtttttcca taggctccgc ccccctgacg agcatcacaa aaatcgacgc 16020 
tcaagtcaga ggtggcgaaa cccgacagga ctataaagat accaggcgtt tccccctgga 16080 
agctccctcg tgcgctctcc tgttccg^c ctgccgctt* ccggatacct gtnngccttt 16140 
ctcccttcgg gaagcgtggc gcttttccgc tgcataaccc tgcttcgggg tcattatagc 16200 
gattttttcg gtatatccat cctttttcgc acgatataca ggattttgcc aaagggttcg 162 60 
tgtagacttt ccttggtgta tccaacggcg tcagccgggc aggataggtg aagtaggccc 16320 
acccgcgagc gggtgttcct tcttcactgt cccttattcg cacctggcgg tgctcaaogg 16380 
gaatcctgct ctgcgaggct ggccggctac cgccggcgta acagatgagg gcaagcggat 16440 
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ggctgatgaa accaagccaa ccaggaaggg cagcccacct atcaaggtgt actgccttcc 16500 

agacgaacga agagegati-.g aggaaaagcrc cracggcggcc ggcatgagcc tgtcggccta 16560 

cctgctggcc gtcggccagg gcfcacaaaat cacgggcgtc gtggactatg agcacgtccg 16620 

cgagctggcc cgcatcaatg gcgacctggg ccgcctgggc ggcctgctga aactctggct 16680 

caccgacgac ccgcgcacgg cgcggttcgg tgatgccacg atcctcgccc tgctggcgaa 16740 

gatcgaagag aagcaggacg agcttggcaa ggtcatgatg ggcgtggtcc gcccgagggc 16800 

agagccatga cttttttagc cgctaaaacg gccggggggt gcgcgtgatt gccaagcacg 16860 

tccccatgcg ctccatcaag aagagcgact tcgcggagct ggtgaagtac atcaccgacg 16920 

agcaaggcaa gaccgagcgo cfcfcfcgcgaag etca 16954 
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<223> n is a, c, g, or t 
<400> 44 

cuyggctggt tgccctcgoc gctgggctgg eggccgfccta tggccctgca aacgcgccag 60 

aaacgccgtc gaagccgtgt gcgagacacc gcggccgccg gcgttgtgga tacctcgcgg 120 

aaaacttggc cctcactgac agatgagggg cggacgttga cacttgaggg gccgactcac 180 

ccggcgcggc gttgacagat gaggggcagg ctcgatttcg gccggcgacg fcggagctggc 240 

cagcctcgca aatcggcgaa aacgcctgat tttacgcgag tttcccacag atgatgtgga 300 

caagcctggg gataagtgcc ctgcggtatt gacacttgag gggcgcgact actgacagat 360 

gaggggcgcg atccttgaca cttgaggggc agagtgctga cagatgaggg gcgcacctat 420 

tgacatttga ggggctgtcc; acaggcogaa aafcccagcat ttgcaagggt ttcegr.r.ngt 480 

ttttcggcca ccgctaacct gtcttttaac ctgctfcttaa accaatattt afcaaaccttg 540 

tttttaacca gggctgcgcc ctgtgcgcgt gaccgcgcac gccgaagggg ggtgcccccc 600 

cttctcgaac cctcccggcc cgctaacgcg ggcctcccat ccccccaggg gctgcgcccc 660 

bcggccgcga acggcctcac cccaaaaatg gcagcgctgg cagtccttgc cattgccggg 720 

atcggggcag taacgggatg ggcgatcagc ccgagcgcga cgcccggaag cattgacgtg 780 

ccgcaggtgc tggcatcgac attcagcgac caggtgccgg gcagtgaggg cggcggcctg 840 

ggtggcggcc tgcccttcac ttcggccgtc ggggcattca cggacttcat ggcggggccg 900 

gcaattttta ccttgggcat tcttggcata gtggtcgcgg gtgccgtgct cgtgttcggg 960 

ggtgcgataa acccagcgaa ccatttgagg tgataggtaa gattataccg aggtatgaaa 1020 

acgagaattg gacctfctaca gaattactct atgaagcgcc atatttaaaa agctaccaag 1080 

. bgaagaggat gaggaggcag afctgeettcra atafcattgac aatactgata 1140 
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agataatata tcttttatat agaagatatc gccgtatgta aggatttcag ggggcaaggc 1200 
ataggcagcg cgcttatcaa tatatctata gaatgggcaa agcataaaaa cttgcatgga 1260 
ctaatgcttg aaacccagga caataacctt atagcttgta aattctatca taattgggta 1320 
atgactccaa cttattgata gtgttttatg ttcagataat gcccgatgac tttgtcatgc 1380 
agctccaccg attttgagaa cgacagcgac ttccgtccc* g cc g t g cc a g gtgctgente 1440 
agattcaggt tatgccgctc aattcgctgc gtatatcgct tgctgattac gtgcagcttt 1500 
ceettcaggc gggattcata cagcggccag ccatcogfcca tccatatcac cacgtcaaag 1560 
ggtgacagca ggctcataag acgccccagc gtcgccatag tgcgttcaco gaatacgtgc 1620 
gcaacaaccg tcttccggag actgtcatac gcgtaaaaca gccagcgctg gcgcgattta 1680 
gccccgacat agccccactg ttcgtccatt tccgcgcaga cgatgacgtc actgcccggc 1740 
tgtafcgcgcg aggttaccga ctgcggcctg agttttttaa gtgacgtaaa atcgtgttga 1800 
ggccaacgcc cataatgcgg gctgttgccc ggcatacaac goorttct, ^tca, 1S60 
tgattttctg gtgcgtaccg ggttgagaag cggtgtaagt gaactgcagt tgccatgttt 1920 
t^mo-ota agagcagaga tagcgctgat gtccggcggt gcttttgccg ttacgcacca 1980 
ccccgtcagt agctgaacag gagggacagc tgatagacac agaagccact ggagcacctc 2040 
aaaaacacca tcatacacta aatcagtaag ttggcagcat cacccataat tgtggtttca 2100 
aaatcggctc cgtcgatact atgttatacg ccaactttga aaacaacttt gaaaaagctg 2160 
ttttctggta tttaaggttt tagaatgcaa ggaacagtga attggagttc gtcttgttat 2220 
aattagcttc ttggggtatc tttaaatact gtagaaaaga ggaaggaaat aata^c 2280 
taaaatgaga atatcaccgg aattgaaaaa actgatcgaa aaataccgot gcgtaaaaga 2340 
Lacggaagga .tgtefceefcg ntaaggtata taagctggtg ggagaaaatg aaaacctata 2400 
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fcttaaaaatg acggacagcc ggtataaagg gaccacctat gatgtggaac gggaaaagga 2460 
catgatgcta tggctggaag gaaagctgcc tgttccaaag gtcctgcact ttgaacggca 2520 
tgatggctgg agcaatctgc tcatgagtga ggccgatggc gtcctttgct cggaagagta 2580 
tgaagatgaa caaagccctg aaaagattafc cgagctgtat gcggagtgca tcaggctctt 2640 
tcactccatc gacatatcgg attgtcccta tacgaatagc ttagacagcc gcttagcca* 2700 
attggattac ttactgaata acgatctggc cgatgtggat tgcgaaaact gggaagaaga 2760 
eantee-ttt aaaaatccgc gcgagctgta tgatttttta aagacggaaa agcccgaaga 2820 
ggaacttgtc ttttcccacg gcgacctggg agacagcaac atctttgtga aagatggcaa 2 880 
agtaagtggc tttattgatc ttgggagaag cggcagggcg gacaagtggt atgacattgc 2940 
cttctgcgtc cggtcgatca gggaggatat cggggaagaa cagtatgtcg agetattttt 3000 
tgacttactg gggatcaagc ctgattggga gaaaataaaa tattatattt tactggatga 3060 
attgttttag tacctagatg tggcgcaacg atgccggcga caagcaggag cgcaccgact 3120 
tcttccgcat caagtgtttt ggctctcagg ccgaggccca cggcaagtat ttgggcaagg 3180 
ggtcgctggt attcgtgr.ag ggcaagattc ggaataccaa gtacgagaag gacggccaga 3240 
cggtctacgg gaccgacttc attgccgata aggtggatta tctggacacc aaggcaccag 3300 
gcgggtcaaa tcaggaataa gggcacattg ccccggcgtg agtcggggca atcccgcaag 3360 
gagggtgaat gaatcggacg tttgaccgga aggcatacag gcaagaactg atcgacgcgg 3420 
ggttttccgc cgaggatgcc gaaaccatcg caagccgcac cgtcatgcgt gcgccccgcg 3480 
aaaccttcca gtccgtcggc tcgatggtcc agcaagctac ggccaagatc gagcgngaca 3540 
gcgtgcaact ggctccccct gccctgcccg cgccatcggc cgccgtggag cgttcgcgtc 3600 
gtctcgaaca ggaggeggca ggtfctgcrcga agtc gatgac catcgacacg cgaggaacta 3660 
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tgacgaccaa gaagcgaaaa accgccggcg aggacctggc aaaacaggtc agcgaggcca 3720 

agcaggccgc gttgctgaaa cacacgaagc agcagatcaa ggaaatgcag ctttccttgt 3780 

tcgatattgc gccgtggccg gacacgatgc gagcgatgcc aaacgacacg gcccgctctg 3840 

ccctgttcac cacgcgcaac aagaaaatcc cgcgcgaggc gctgcaaaac aaggtcattt 3900 

tccacgtcaa caaggacgtg aagatcacct acaccggcgt cgagctgcgg gccaacgatg 3960 

acgaactggt gtggaagcag gtgttggagt acgcgaagcg cacccctatc ggcgagccga 402 0 

teaccttcac gttctacgag ctfctgccagg acctgggctg gtcgatcaat ggccggtatt 40 80 

acacgaaggc cgaggaatgc ctgtcgcgcc tacaggcgac ggcgatgggc ttcacgtccg 4140 

accgcgttgg gcacctggaa tcggtgtcgc tgctgcaccg ctfcccgcgtc ctggaccgtg 4200 

gcaagaaaac gtcccgttgc caggtcctga tcgacgagga aatcgtcgtg ctgtttgctg 4260 

gogaccacta cacgaaattc atatgggaga agtaccgcaa gctgtcgccg acggcccgac 4320 

ggatgttcga ctatttcagc tcgcaccggg agccgtaccc gctcaagctg gaaaccttcc 4380 

gcctcatgtg cggatcggat tccacccgcg tgaagaagtg gcgcgagcag gtcggcgaag 4440 

cctgogaaga gttgcgaggc agcggcctgg tggaacacgc ctgggtcaat gatgacctgg 4500 

tgcattgcaa acgctagggc cttgtggggt cagttccggc tgggggttca gcagccagcg 4560 

Ctttactggc atttcaggaa caagogggwa ctgcfccgacg caotfcgctto gcteagtatc 4620 

gctcgggacg cacggcgcgc fcctacgaact gccgataaac agaggattaa aattgacaat 4680 

tgtgattaag gctcagattc gacggcttgg agcggccgac gtgcaggatt tccgcgagat 4740 

ccgattgtcg gccctgaaga aagctccaga gatgttcggg tccgtttacg agcacgagga 4800 

gaaaaagccc atggaggcgt tcgctgaacg gttgcgagat gccgtggcat tcggcgccta 4860 

catcgacggc gagatcattg ggctgtcggt cttcaaacag gaggacggcc ccaaggacgc 4920 
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fccacaaggcg catctgtccg gcgttttcgt ggagcccgaa cagcgaggcc gaggggtcgc 4930 

cggtotgctg ctgcgggcgt tgceggagsg fctfcatterctc atgatgatcg tccgacagat 5040 

tccaacggga atctggtgga tgcgcatctt catcctcggc gcacttaata tttcgctatt 5100 

ctggagcttg ttgtttattt cggtctaccg cctgccgggc ggggtcgcgg cgacggtagg 5160 

cgctgtgcag ccgctgatgg tcgtgttcat ctctgccgct ctgctaggta gcccgatacg 5220 

attgatggcg gtcctggggg ctatttgcgg aactgcgggc gtggcgctgt tggtgttgac 5280 

accaaacgca gcgctagatc ctghcggcgt cgcagcgggc ctggcggggg cggtttccat 5340 

ggcgttcgga accgtgctga cccgcaagtg gcaacctccc gtgcctctgc tcacctttac 5400 

cgcctggcaa ctggcggccy y^ggactfcct gctcgttcca gtagetttag tgtttaatcc 5460 

gccaatcccg atgcctacag gaaccaatgt tctcggcctg gcgtggctcg gcctgatcgg 5520 

agcgggttta acctacttcc tttggttccg ggggatctcg cgactcgaac ctacagttgt 5580 

ttccttactg ggctttctca gccccagatc tggggtcgat cagccgggga tgcatcaggc 5640 

cgacagtcgg aacttcgggt ccccgacctg taccattcgg tgagcaatgg ataggggagt 5700 

tgatatcgtc aacgttcact tctaaagaaa tagcgccact cagcttcctc agcggcttta 5760 

tccagcgatt tcctattatg tcggcatagt tctcaagatc gacagcctgt cacggttaag 5820 

cgagaaatga ataagaaggc tgataattcg ya fcctcfcgcg agggagatg* t*tfctg»fcfla 5880 

caggcagcaa cgctctgtca tcgttacaat caacatgcta ccctccgcga gatcatccgt 5940 

gtttcaaacc cggcagctta gttgccgttc ttccgaatag categgtaac atgagcaaag 6000 

tctgccgcct taca acggct ctcccgctga cgccgtcccg gactgatggg ctgcctgtat 6060 
cgagt ggtga ttttgtgccg agctgccggt aggggagctg ttggctggct ggtggcagga 6120 
tatattgtgg tgtaaacaaa ttgacgctta gacaacttaa taacacattg cggacgtttt 6180 
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taatgtactg gggtggtttt tcttttcacc agtgagacgg gcaacagctg attgcccttc 6240 

accgcct3gc c C tg agagag tt gea gr.aa g cggtccacgc tggtttgccc cagcaggcga 6300 

aaatcctgtt tgatggtggt tccgaaatcg gcaaaatccc ttabaaatca aaagaatagc 6360 

ccgagatagg gttgagtgtt gttccagttt ggaacaagag tccactatta aagaacgtgg 6420 

actccaacgt caaagggcga aaaaccgtct atcagggcga tggcccacta cgtgaaccat 6480 

cacccaaatc aagttttttg gggtcgaggt gccgtaaagc acfcaaatcgg aaccctaaag 6540 

ggagcccccg atttagagct tgacggggaa agccggcgaa cgtggcgaga aaggaaggga 6600 

agaaagcgaa aggagcgggc gccattcagg ctgcgcaact gttgggaagg gcgatcggtg 6660 

cgggcctctt cgct*LL*cg ccagctggog aaaggggg^. gtgctgcaaa gcgattaagt 6720 

tgggtaacgc cagggttttc ccagtcacga cgttgtaaaa cgacggccag tgaattcgag 6780 

ctcggtaccc ggggatcttt cgacactgaa atacgtcgag cctgctccgc ttggaagcgg 6840 

cgaggagcct cgtcctgtca caactaccaa catggagtac gataagggcc agttccgcca 6900 

gctcattaag agccagttca tgggcgttgg catgatggcc gtcatgcatc tgtacttcaa 6960 

gtacaccaac gctcttctga tccagtcgat catccgctga aggcgctttc gaatctggtt 7020 

aagatccacg tcttcgggaa gccagcgact ggtgacctcc agcgtccctt taaggctgcc 7080 



aacagctttc tcagccaggg ocagcucwg 



nccgacaagg gctccctcca gaacgocgag 



aagaactgga ggggtggtgt caaggaggag taagctcctt attgaagtcg gaggacggag 7200 

cggtgtcaag aggatattct tcgactctgt attatagata agatgatgag gaattggagg 7260 

tagcatagct tcatttggat ttgctttcca ggctgagact ctagcttgga gcatagaggg 7320 

tcctttggct ttcaatattc fccaagtatct cgagtttgaa cttattccct gtgaaccttt 7380 

tattcaccaa tgagcattgg aatgaacatg aatctgagga ctgcaatcgc catgaggttt 7440 
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tcgaaataca tccggatgtc gaaggcttgg ggcacctgcg ttggttgaat ttagaacgtg 7500 

gwouittfl. tc^tccgata gctctgcaaa craongl-.tgca caatgcaagt caaacgttgc 7560 

tagcagttcc aggtggaatg ttatgatgag oahtgtatta aatcaggaga tatagcatga 7620 

tctetagt'ta gctcaccaca aaagtcagac ggcgtaacca aaagtcacac aacacaagct 7680 

gtaaggattt cggcacggct acggaagacg gagaagccac cttcagtgga ctcgagtacc 7740 

' atttaattct atttgtgttt gatcgagacc taatacagcc cctacaacga ccatcaaagt 7800 

cgtatagcta ccagtgagga agtggactca aatcgacttc agcaacatct cctggataaa 7860 

ctttaagcct aaactataca gaataagata ggtggagagc ttataccgag ctcccaaatc 7920 

tgtccagatc atggttgacc gyLgcctgga tcbtcotata gaatoatcet fe^htecgttga 7980 

cctagctgat tctggagtga cccagagggt catgacttga gcctaaaatc cgccgcctcc 8040 

accatttgta gaaaaatgtg acgaactcgt gagctctgta cagtgaccgg tgactctttc 8100 

tggcatgcgg agagacggac ggacgcagag agaagggctg agtaataagc cactggccag 8160 

acagctctgg cggctctgag gtgcagtgga tgattattaa tccgggaccg gccgcccctc 8220 

cgccccgaag tggaaaggct ggtgtgcccc tcgttgacca agaatctatt gcatcatcgg 82 80 
agaatatgga gcttcatcga atcaccggca gtaagcgaag gagaatgtga agccaggggt 8340 
gtatagccgt cggcgaaata gcatgccatt aaccUggts cagaagtcca attgottccg 8400 

atctggtaaa agattcacga gatagtacct tctccgaagt aggtagagcg agtacccggc 8460 
gcgtaagctc cctaatbggc ccatccggca tctgtagggc gtccaaatat cgtgcctctc 8520 
ctgctttgcc cggtgtatga aaccggaaag gccgctcagg agctggccag cggcgcagac 8580 
cgggaacaca ^gctggcagfc cgacccatcc ggtgctctsc actcgacctg ctgaggtCCC 



8640 
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tcagtccctg gtaggcagct ttgccccgtc tgtccgcccg gtgtgtcggc ggggttgaca 8700 

aggtcgttgc gtcagtccaa catttgttgc catattttcc tgctctcccc accagctgct 8760 

cttttctttt ctctttcttt tcccatcttc agtatattca tcttcccatc caagaacctt 8820 

tatttcccct aagtaagtac tttgctacat ccatactcca tccttcccat cccttattcc 8880 

tttgaacctt tcagttcgag ctttcccact tcatcgcagc ttgactaac* gotaccccga 8940 

ttgagcagac atcaccatgc ctgaactcac cgcgacgtct gtcgagaagt ttctgatcga 9000 

aaagttcgac agcgtctccg acctgatgca gctctcggag ggcgaagaat ctcgtgcttt 90 60 

cagcttcgat gtaggagggc gtggatatgt cctgcgggta aatagctgcg ccgatggttt 9120 

ctacaaagat cgttatgttt atcggcactt tgcatcggcc gcgctcccga ttccggaagt 9180 

gcttgacatt ggggaattca gcgagagcct gacctattgc atctcccgcc gtgcacaggg 9240 

tgfcoacgttg caagacctgc ctgaaaccga actgcccgct gttctgcagc cggtcgcgga 9300 

ggccatggat gcgatcgctg cggccgatct tagccagacg agcgggttcg gcccattcgg 9360 

accgcaagga atcggtcaat acactacatg gcgtgatttc atatgogcga ttgctgatcc 9420 

ccatgtgtat naetoocaaa ctgtgatgga cgacaccgtc agtgcgtccg tcgcgcaggc 9480 

tctcgatgag ctgatgcttt gggcogagga ctgccccgaa gtccggcacc tcgtgcacgc 9540 

ggatttcggc tccaacaatg tcctgacgga caatggccgc ataacagcgg tcattgactg 9600 

gagcgaggcg atgttcgggg attcccaata cgaggtcgcc aacatcttct tctggaggcc 9660 

gtggttggct tgtatggagc agcagacgcg ctacttcgag cggaggcatc cggagcttgc 9720 

aggatcgccg cggctccggg cgtatatgct ccgcattggt cttgaccaac tctatcagag 9780 

cttggttgac ggaaatttcg atgatgcagc . ttgggcgcag ggtcgatgcg acgcaatcgt 9840 

cc^tecgga gcagggactg tagggr.gfcac acaaatcgcc cgcagaagcg cggccgtctg 9900 
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gaccgatggc tgtgtagaag tactcgccga tagtggaaac cgacgcccca gcactcgtcc 9960 
gagggcaaag gaatagagta gatgccgacc gcgggatcga tccacttaac gtfcactgaaa 10020 
tcatcaaaca gcttgacgaa tctggatata agatcgttgg tgtcgatgtc agctccggag 10080 
ttgagacaaatggtgttcag gatctcgata agatacgttc atttgtccaa gcagcaaaga 10140 . 
gtgccttcta gtgatttaat agctccatgt caacaagaat aaaacgcgtt Ltcgggttta 10200 
cctcttccag atacagctca tctgcaatgc attaatgcat tgactgcaac ctagtaacgc 10260 
ettacMBct ccggcgaaga gaagaatagc ttagcagagc tattttcatt tfccgggagac 10320 
gagatcaagc agatcaacgg tcgtcaagag acctacgaga ctgaggaatc cgctcttggc 10380 
tccacgcgac tatatatttg tctctaattg tactttgaca tgctcctctt ctttactctg 10440 
atagcttgac tatgaaaatt ccgtcaccag cncctgggtt cgeaaagata attgcatgtt 10500 
tcttccttga actctcaagc ctacaggaca cacattcatc gtaggtataa acctcgaaat 10560 
canttcctac taagatggta tacaatagta accatgcatg gttgcctagt gaatgctccg 10520 
taacacccaa tacgccggcc gaaacttttt tacaactctc ctatgagtcg tttacccaga 10680 
atgcacaggt .nsettottt agaggtaatc cttctttcta gctagaagtc ctcgtgtact 10740 
■ gtgtaagcgc ccactccaca tctccactcg acctgcaggc atgcaagctt agagataaaa 10800 
taaaaagaga agaaaagaaa gtttgtacaa tttctttttg tttatataac atacacgcta 10860 
tgtcaacatt tagaataagg gggaaaaaat cttccatcat attcgaatgc acaagattafc 10920 
ttctttgttc gctctttttg gtcgggtcat cgagatttag agtgtaatca aagatactgt 10980 
catctcgaga gcgttgcaca ggctgctgtt tgccaaattg gatgtttgcc gaattagtaa 11040 
aatacgcaag catttcttac ctttccgctc ccttttccta attctcccaa agactaaatg 11100 
aggaaagafca aaggaoaaag aaaatcrfcaaa gacaaaaaaa ttgaaaacga tataaacttg 11160 
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cagcacgtaa gaccaaagca aattggtaac tattcttgfcg tacaaacatg tataaaaaaa 11220 

aacttttttt tgctcctgga ggacaaaatt tcaaactcct tgaagaagat tgcttgtata 11280 

tctatcatat gcatatatca tatcgatgga aaaagaaagt caggcatgta tttataaaaa 11340 

gaagaatgtg ccatgcttcc gaatttctfct tcactttctt ttecttatct attttaatct 11400 

catgttgtgg atttggaatg ccctg<*tc:gU fcttcgttacc gtgattggca tggaagfcgat 11460 

tgctgcactg gcacacaaat acatcatgca cggctggggt tggggatggc atctfctcaca 11520 

tcatgaaccg cgtaaaggtg cgtttgaagt taacgatctt tatgccgtgg tttttgctgc 11580 

attatcgatc ctgctgattt atctgggcag tacaggaatg tggccgctcc agfcggattgg 11640 

cgcaggtatg acggcgtatg gattactcta ttttatggtg cacgacgggc tggtgcatca 11700 

acgttggcca ttccgctata ttccacgcaa gggctacctc aaacggttgt atatggcgca 11760 

ccgtatgcat cacgccgtca ggggcaaaga aggttgtgtt tcttttggct tccfcctatgc 11820 

gccgcccctg tcaaaacfctc aggcgacgct ccgggaaaga catggcgcta gag^yggcgc 11000 

tgccagagat gcgcagggcg gggaggatga gcocgcatcc gggaagtaag ggcctgacca 11940 

gaggcggcca gcagcagcgt taatttttcg ggcgtggtcg ttgactgccg ctgatcccaa 12000 

agcttggcgt aatcatggtc atagctgttt cctgtgtgaa attgttatcc gctcacaatt 12060 

ccacacaaca tacgagccgg aagcataaag tgtaaagcct ggggtgccta atgagtgagc 12120 

taactcacat taattgcgtt gcgctcactg cccgctttcc agfccgggaaa cctgtcgtgc 12180 

cagctgcatt aatgaatcgg ccaacgcgcg gggagaggcg gtttgcgtat tgggccaaag 12240 

acaaaagggc gacattcaac cgattgaggg agggaaggta aatattgacg gaaattattc 12300 
attaaaggtg aattatcacc gtcaccgact tgagccattt gggaattaga gccagcaaaa 12360 
tcaccagtag caccattacc attagcaagg ccggaaacgt caccaatgaa accatcgata 12420 



WO 2004/063358 PCT/EP2O04/O00XOO 



gcagcaccgt aatcagtagc gacagaatca agtttgcctt tagcgtcaga ctgtagegcg 12480 
ttcto^W cattttcggt ..t^aenoc ttattagcgt ttgccatctt ttcataatca 12540 
aaatcaccgg aaccagagcc accaccggaa ccgcctccct cagagccgcc accctcagaa 12600 
ccgccaccct cagagccacc accctcagag ccgccaccag aaccaccacc agagccgccg 12660 
ccagcattga caggaggccc gatctagtaa catagatgac accgcgcgcg ataatttatc 12720 
ctagtttgcg cgctatattt tgttttctat cgcgtattaa atgtataatt gcgggactct 12780 
aatcataaaa acccatctca taaataacgt catgcattac atgttaatta ttacatgctt 12840 
aacgtaattc aacagaaatt atatgataat catcgcaaga ccggcaacag gattcaatct 12900 
taagaaactt t attgcc~~ tgtttgoaog afccggg^n atccggcrtct gtggcgggaa 12960 
ctccacgaaa atatccgaac gcagcaagat atcgcggtgc atctcggtct tgcctgggca 13020 
gtcgccgccg acgccgttga fcgtggacgcc gggcccgatc atattgtagc tcaggatcgt 13080 
ggcgttgtgc ttgtcggccg ttgctgtcgt aatgatatcg gcaccttcga ccgcctgttc 13140 
cgcagagatc ccgtgggcga agaactccag catgagatcc ccgcgctgga ggatcatcca 13200 
gccggcgtcc cggaaaacga ttccgaagcc caacctttca tagaaggcgg cggtggaatc 13260 
gaaatctcgt gatggcaggt tgggcgtcgc ttggtcggtc atttcgaacc ccagagtccc 13320 
gctcagaaga actcgtcaag aaggc^tag mtgo gotg»a»t« ggcragcaacg 13380 
ataccgtaaa gcacgaggaa gcggtcagnc cattcgccgc caagctcttc agcaatatca 13440 
cgggtagcca acgctatgtc ctgatagcgg tccgccacac ccagccggcc acagtcgatg 13500 
aatccagaaa agcggccatt ttccaccatg atattcggca agcaggcatc gccatgggtc 13560 
aogacgagat catcgccgtc gggcatgcgc gccttgagcc tggcgaacag ttcggctggc 13620 
gcgagcccct gatgctctto gtccagatca tcctgatcga caagaccggc ttccatccga 13680 
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S8Q0 
13860 
13920 
13980 



gtacgtg ctc gctcgatgcg atgtttcgct tggtggtcga atgggcaggt agccggatca 13740 
agcg t atg c Q gccg co g ca t atgatggata ctttctcggc aggagcaagg 13 

tgagatgaca ggagatcctg ccccggcact tcgcccaata gcagccagfcc ccttcccgct 
tcagtgacaa cgtcgagcac agntgcgcaa ggaacgcccg tcgtggccag ccacgatagc 
cgcgctgcct cgtcctgcag ttcattcagg gcaccggaca ggtcggtctt gacaaaaaga 
accgggcgcc cctgcg.tga cagccggaa. acggcggcat cagagcagcc gattgtctgt 14040 
tgtgcccagt catagccgaa tagcctctcc acccaagcgg ccggagaacc tgcghgcaat X4100 
ccatcttgtt caatcatgcg aaacgatcca gatccggtgc agattatttg gattgagagt 14160 
gaatatgaga ctct-ttw ^c 0gaggg ^ttataa aacgtcagtg gagcattttt 14220 
gacaagaaat atttgctagc tgatagtgac cttaggcgac ttttgaacgc gcaataatgg 14280 
tttctgacgt atgtgcttag ctcattaaac tccagaaacc cgcggctgag tggctccttc 14340 
aacgttgcgg ttctgtcagt tccaaacgta aaacggcttg tcccgcgtca tcggcggggg U400 
tcataacgtg actcccttaa ttctccgctc atgatcagat tgtcgtttcc cgccttcagt 14460 
ttaaactatc agtgtttgac aggatatatt ggcgggtaaa cctaagagaa aagagcgttt 14520 
attagaataa tcggatattt aaaagggcgt gaaaaggttt atccgttcgt ccatttgtat 14580 
gtgcatgcca accacagggt ™t c t « „ a£f caagacg agcaagattg 14640 
gccgccgccc gaaacgatcc gacagcgcgc ccagcacagg tgcgcaggca aattgcacca 14700 
acgcatacag cgccagcaga atgccatagt gggcggtgac gtcgttcgag tgaaccagat 14760 
cgcgcaggag gcccggcagc accggcataa tcaggccgat gccgacagcg tcgag.gcga 14820 
cagtgctcag aattacgatc aggggtatgt tgggtttcac gtctggcctc cggaccagcc 14880 
tccgotggtc ogattgaacg cgcggattct ttatcactga taagttggtg gacatattat 14940 
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gtttatcagt gataaagtgt caagcatgac aaagttgcag ccgaatacag tgatccgtgc 15000 
cgc.ctggac ctgttgaacg aggtegg.gt aaacggtctg acgacacgca aactggcgga 15060 
acggttgggg gttcagcagc cggcgcttta ctggcacttc aggaacaagc gggcgctgct 15120 
cgacgcactg gccgaagcca tgctggcgga gaatcatacg cattcggtgc cgagagccga 15180 
cgacgactgg cgctcatttc tgatcgggaa tgcccgcagc ttcaggcagg cgctgctcgc 15240 
ctaccgagat ggcgcgcgca tccatgccgg cacgcgaccg ggcgcaccgc agatggaaac 15300 
ggccgacgcg cagcttcgct tcctctgcga ggcgggtttt tcggccgggg acgccgtcaa 15360 
tgcgctgatg acaatcagct acttcactgt tggggccgtg cttgaggagc aggccggcga 15420 
cagcgatgcc ggcgaycgcg gcggcaccgt tgaacaggr.h ccgctctcgc cgctgttgcg 15480 
ggccgcgata gacgccttcg acgaagccgg tccggacgca gcgttcgagc agggactcgc 15540 
ggtgattgtc gatggattgg cgaaaaggag gctcgttgtc aggaacgttg aaggaccgag 15600 
aaagggtgac gattgatcag gaccgctgcc ggagcgcaac ccactcacta cagcagagcc 15660 
atgtagacaa catcccctcc ccctttccac cgcgtcagac gcccgtagca gcccgctacg 15720 
ggctttttca tgccctgccc tagcgfcccaa gcctcacggc cgcgctcggc ctctctggcg 15780 
gccttctggc gctcttccgc ttcctcgctc actgactcgc tgcgctcggt cgttcggctg 15840 
cggcgagcgg tatcagctca ctcms gtaatooggt tatccaeaga ataaggggat 15900 
aacgcaggaa agaacatgtg agcaaaaggc cagcaaaagg ccaggaaccg taaaaaggcc 15960 
gcgttgctgg cgtttttcca taggctccgc ccccctgacg agcatcacaa aaatcgacgc 16020 
tcaagtcaga ggtggcgaaa cccgacagga ctataaagat accaggcgtt tccccctgga 16080 

agctccctcg tgcgctCt0 e ffltfcncoaco ctgccgctta ccggatacct gtccgccttt 16140 
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ctcccttcgg gaagcgtggc gcttttccgc tgcataaccc tgcttcgggg tcattatagc 16200 
gattttttcg gtatatccat cctttttcgc acgatataca ggattttgcc aaagggttcg 16260 
tgtagacttt ccttggtgta tccaacggcg tcagccgggc aggataggtg aagtaggccc 16320 
acccgcgagc gggtgttcct tcttcactgt cccttattag cacctggcgg tgctcaacgg 16380 
gaatcctgct ctgcgaggct ggccggctac cgccggcgtra acagaty^g gc^gcggat 
ggctgatgaa accaagccaa ccaggaaggg cagcccacct atcaaggtgt aetgccttcc 
agaogaa cg a agascaattg aggaaaaggc ggcggcggcc ggcatgagcc tgtcggccta 
cctgctgg.cn gtcggccagg gctacaaaat cacgggcgtc gtggactatg agcacgfcccg 16620 
cgagctggcc cgcatcaatg gcgacctggg ccgcctgggc ggcctgctga aactctggct 16680 
caccgacgac ccgcgcacgg cgcggttcgg tgatgccacg atcctcgccc tgctggcgaa 16740 
gatcgaagag aagcaggacg agcttggcaa ggtcatgatg ggcgtggtcc gcccgagggc 16800 
agagccatga cttttttagc cgctaaaacg gccggggggt gcgcgtgatt gccaag^cg 16860 
tccccatgcg ctccatcaag aagagcgact tcgcggagct ggtgaagtac atcaccgacg 16920 
agcaaggcaa gaoogagnge ctttcrccracg 
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<223> n is a, c, g, or t 
<220> 

<221> mlsc„feature 
<222> (19178).. (19178) 

<223> n is a, c, <3, or t 

<220> 

<221> misc_£eattire 

<222> (19269).. (19269) 

<223> n is a, C. g, or t 

<400> 4,5 

agcttggtac cgagctcgga tccactagta acggccgcca gtgtgctgga attcgccctt 

gacggccagt gaattcgagc tcggtacccg gggatctttc gacactgaaa tacgtcgagc 120 

ctgctccgct tggaagcggc gagg^yuctc gtcctgtco aaeta^aac atggaatacg 180 

ataagggcca gttccgccag ctcattaaga gccagttcat gggcgttggc atgatggccg 240 

tcatgcatct gtacttcaag tacaccaacg ctcttctgat ccagtcgatc atccgctgaa 300 

ggcgctttcg aatctggtta agatccacgt cttcgggaag ccagcgactg gtgacctcca 360 

gcgtcccttt aaggctgcca acagctttct cagccagggc cagcccaaga ccgacaaggc 420 

ctccctccag aacgccgaga agaactggag gggtggtgtc aaggaggagt aagctcctta 480 

ttgaagtcgg aggacggagc ggtgtcaaga ggatattctt cgactctgta ttatagataa 540 

gatgatgagg aattggaggt agcatagctt cattt^tt tgctttocag «e*w«*o 600 
tagcttggag catagagggt cctttggctt tcaatattct caagtatctc gagtttgaac 660 
ttattcccta tgaacctttt attcaccaat gagcattgga atgaacatga atctgaggac 720 
tgcaatcgcc atgaggtttt cgaaatacat ccggatgtcg aaggcttggg gcacctgcgt 780 
tggttgaatt tagaacgtgg cactattgat catccgatag ctctgcaaag ggcgttgoac 840 
aatgcaagtc aaacgttgct agcagttcca ggtggaatgt tatgatgagc attgtattaa 900 



WO 2004/063358 PCT/EP2004/000100 
214/358 

atcaggagat atagcatgat ctctagttag ctcaccacaa aagtcagacg gcgtaaccaa 960 

aagtuacac* aoacoagdtg taaggattte g^acggcta cggaagacgg agaagccacc 1020 

ttcagtggac tcgagtacca tttaattcta tttgtgtttg atcgagacct aatacagccc 1080 

ctacaacgac catcaaagtc gtatagctac cagtgaggaa gtggactcaa atcgacttca 1140 

gcaacatctc ctggataaac tttaagccta aactatacag aataagatag gtggagagct 1200 

tataccgagc tcccaaatct gtccagatca tggttgaccg gtgcctggat cttcctatag 1260 

aatcatcctt attcgttgac ctagctgatt ctggagtgac ccagagggtc atgacttgag 1320 

cctaaaatcc gccgcctcca ccatttgtag aaaaatgtga cgaactcgtg agctctgtac 1380 

agtgaccggt gactcttteL ggcatgegga gagaoggacg gacgcagaga sjaagggctaa 1440 

gtaataagcc actggccaga cagctctggc ggctctgagg tgcagtggat gattattaat 1500 

ccgggaccgg ccgcccctcc gccccgaagt ggaaaggctg gtgtgcccct cgttgaccaa 1560 

gaatctattg catcatcgga gaatatggag cttcatcgaa tcaccggcag taagcgaagg 1620 

agaatgtgaa gccaggggtg tatagccgtc ggcgaaatag catgccatta acctaggtac 1680 

agaagtccaa ttgcttccga tctggtaaaa gattcacgag atagtacctt ctccgaagta 1740 

ggtagagcga g .tacccggcg cgtaagctcc ctaattggcc catccggcat ctgtagggcg 1800 

tccaaatatc gtgcctctcc tgctttgccc ygtgtatgaa a^ggaaagg cogctcaatja 18 60 

gctggccagc ggcgcagacc gggaacacaa gctggcagtc gacccatccg gtgctctgca 1920 

ctcgacctgc tgaggtccct cagtccctgg taggcagctt tgccccgtct gtccgcccgg 1980 

tgtgtcggcg ggg ttgacaa ggtcgttgcg tcagtccaac atttgttgcc atattttcct 2040 

9uLctcccca ccagctgcto ttttofcttf.c tctttctfctt cccatcbtca gtatattcat 2100 
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^ a.ga.ccttt a^ccccta a Bt a. B t.et « 3 =t»ca« detect 2X6. 
crtt cc»tc =c t tat t cct «p« 

tgactaacag tgagcagac. tgacs.tgct g tc g .agct g cagtcaatca - 

g c„c =™tt gaaota.ooc .cg.c.tc.c ac^ccaa. ^tgcctgc "40 
atB =«.gc g gttc g g= t gc — — — 

tggg aaccgt g» g g=t g cc gg c g c ggg o g a tg . g =>.a g 2 «° 
cccg g c gg .« aegggageg ct^cataoc ^ 

, gg c tB cc g c ca« g c. B ca t caa«ggc g — 258 ° 

tglg ,ttt g c calgcac.tg a COgtg09 o g gcgcagtgcc atggggtgaa gtg.ctggc. 2640 
ggcg^ g cat gg a g . t gt »t S cc Cg c t. tg c.caca ,700 

Mgg ca t = t g ^ * ^ " Ca ° a00tC . 

g „ctgg.c= ct tt gaa 3 cc ^ c» Cgu .c t > — * »»<> 

c t « gg cttc tgB c tB occa ,c g t« t g g g BB c BB c= tB c 

gg „ tgBg =a t — — * -" St " 3t "=' 0g - ta3C Cta9tS " M 

gg c gc tttcc galeae »to B ct gB cc tgacctacat g .a B = B cctg ac^cc 
. c ca B ct.« „«=mo a, gt a 0g gW g c g c g ccctg gggta t g«e ttBB gtcca= 
MB ag= tg c » BB a BB tgga B <=gact Bg tc MM 

^ g =gg t agg gt *— ™" " 3 ° 

taaggtgtgg etagagegat gog^gag. cg gg tat gt c a 0gBt o B ac t „«— » -40 
=ca,t gg =at = g gc« t g- *»*«—» ggg^ttg ctggg^aa ^gatgeae "00 
atcatca^ «-*■*■« *™ B ° a3ttBtOCM 
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gctggcgttg aa tcagtgag ggtttgtgat fcggcggttgt gaagcaatga ctccgcccat 3420 
attctatttg tgggagctga gatgatggca tgcttgggat gtgcatggat catggtagtg 3480 
cagcaaacta tattcaccta gggctgttgg taggatcagg tgaggccttg cacattgcat 3540 
gatgtacfccg tcatggtgtg ttggtgagag gatggatgtg gatggatgtg tattctcaga 3600 
cgtagacctt gactggaggc ttgatcgaga gagtgggccg fLtctttg. 9 a W « n P«*° "«> 
tcgtgccaga aatggtgagt ggatgactgt gacgctgtac attgcaggca ggtgagatgc 3720 
actgtcteg8 fctataaaata cattcagatg caagcttggc gtaatcatgg tcatagctgt 
ttcctgtgtg aaattgttat ccgctcacaa ttccacacaa catacgagcc ggaagcataa 
agtgtaaagc ctggggtgcc taatgagtga gctaactcac attaattgcg ttgcgctcac 
tgoccgcttt ccagtcggga aacctgtcgt gccagctgca ttaatgaatc ggccaacgcg 
cggggagagg cggtttgcgt attgggccaa agacaaaagg gcgacattca accgattgag 
ggagggaagg taaatattga cggaaattat tcattaaagg tgaattatca ccgtcaccg* 
cttgagccat ttgggaatta gagccagcaa aatcaccagt agcaccatta ccattagcaa 4140 
^cc^aaac g toae^, aaaccatcga tagcagcacc gtaatcagta gcgacagaat 4200 
caagtttgcc tttagcgtca gactgtagcg cgttttcatc ggcattttcg gtcatagccc 4260 
ccttattagc gtttgccatc ttttcataat caaaatcacc ggaaccagag ccaccaccgg 4320 
aaccgcctcc ctcagagccg ccaccctcag aaccgccaoc ctcagagcca ccaccctcag 4380 
agccgccacc agaaccacca ccagagccgc cgccagcatt gacaggaggc ccgatctagt 4440 
aacatagatg acaccgcgcg cgataattta tcctagtttg cgcgctatat tttgttctot 4,00 
atcgcgtatt aaatgtataa ttgcgggact ctaatcataa aaacccatct cataaataac 
gtcatgcatL aoatgfct-t tat^catgc ttaacgtaat tcaacagaaa ttatatgata 
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. tcat cgcaa gaccggcaac ■ * at9tttg " 

^•i ^ «* — ■ DWW 

atatggcggt gcatetoggt cttgcgtggg cagtcgcgga 18M 

^ tortattgtc .ctc^t. gtMOBttrt gcttgtoggc ggttgctgtc 4860 

gtaatgatat cggcaccttc g,cc g =c tg t tccgcagaga ux^gggo *«° 

« oaW t OOT c Srts g.ggatca t c ***** coo— = gattgggasg «3. 

gat.gaaggc <,g=g a t sg a, to.a.tctg g t g .t gg o. g gttgg gcgtc 5040 

gcttggtcgg tcatttggaa ccccagagtc cggctc.ga. g «»ctc g tc, a g .» g g=g.t =100 

» g .a 8g = g at gegctgcg.a tc ggg a g c gg cg.taccgta ««« aagcggtcag 5160 

ggcttggcc gcc.agctct tcw-tat cacgggtagc ccggtatg tcgtgat.go »>0 

gg t gcgggac *- «— — a " 3CggCCa " tt0 °*"* 

tg.t.ttcgg cw*. tcgcc.tggg tgacgacgag atc.tcgcgg "40 

gcgccttg.g c=«gcga»= agtt.gggtg WW- 54 °° 

sa^gatc g.„.g.-g gcttccatcc gagtacgtgg tcggtcgatg cgatgtttgg 5460 

cttggtg^c gaatgggcag gtagcgggat caagctatg cagccgccgg attggatcag 5520 

ccatgatgg. tactttctgg gcaggagca. ggtgagatga a*—*- tgccccggc. 5580 

e tt cgcgc. taggagccag tcocttgccg cttcagtgac aaogtcgagc ac.gctgggc 5640 
aaggaaoggc ggtcgtggcg agccogat. gccgcgctgc otggtcctgg agttgattca 5700 

ggg »=c g g. .wt^ta "gacaaaaa —W* —•"»■ " 6 ° 

.cacgggggc atgagagcag «W- 5820 
ccagccaagg gggcggag» cctgcgtgc atcctctg ttcaatcatg negate 5880 
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cagatccggt gcagattatt tggattgaga gtgaatatga gactctaatt ggataccgag 5940 

gggaatttat ggaacgtcag tggagc^tfcfc ttgaoaagaa atatttgcta gctgatagtg 6000 

accttaggcg acttttgaac gcgcaataat -ggfcttctgac gtatgtgctt agctcattaa 6060 

actccagaaa cccgcggctg agtggctcct tcaacgfctgc ggttctgtca gttccaaacg 612 0 

taaaacggct tgtcccgcgt catcggcggg ggtcataacg tgactccctt aattctccgc 6180 

tcatgatcag attgtcgbtt cccgccttca gtttaaacta tcagtgtttg acaggatata 6240 

ttggcgggta aacctaagag aaaagagcgt ttattagaat aatcggatat ttaaaagggc 6300 

gtgaaaaggt ttatccgttc gtccatttgt atgtgcatgc caaccacagg gttccccaga 6360 



tctggcgccg gccagcgaga cgaguaagest tggccgcogo 



ocgaaaogat cngacagcgo 6420 



goccagcaca ggtgcgcagg caaattgcac caacgcatac agcgccagca gaatgccata 6480 

gtgggcggtg acgtcgttcg agtgaaccag atcgcgcagg aggcccggca gcaccggcat 6540 

aatcaggccg atgccgacag cgtcgagcgc gacagtgctc agaattacga tcaggggtat 6600 

gttgggtttc acgtctggcc tccggaccag cctccgctgg tccgattgaa cgcgcggatt 6660 

ctttatcact gataagttgg tggacatatt atgtttatca gtgataaagt gtcaagcatg 6720 

acaaagttgc agccgaatac agtgatccgt gccgccctgg acctgttgaa cgaggtcggc 6780 

gtagacggtc tgacgacacg caaactggcg gaacggttgg gggtfccagca gccggcgett 6840 

tactggcact tcaggaacaa gcgggcgctg ctcgacgcac tggccgaagc catgctggcg 6900 

gagaatcata cgcattcggt gccgagagcc gacgacgact ggcgctcatt tctgatcggg 69 60 

aatgcccgca gcttcaggca ggcgctgctc gcctaccgcg atggcgcgcg catccatgcc 7020 

ggcacgcgac cgggcgcacc gcagatggaa acggccgacg cgcagcttcg cttcctctgc 7080 

gaggcgggtt tttcggccgg ggacgccgtc aatgcgctga tgacaatcag ctacttcact 7140 
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gttggggccg tgcttgagga gcaggccggc gacagcgatg ccggcgagcg cggcggcacc 7200 
gttgaacag, ctccgctctc go^tgttg «o«m. tagacgcctt cgacgaagcc 7260 
ggtccggacg cagcgttcga gcagggactc gcggtgattg tcgatggatt ggcgaaaagg 7320 
aggctcgttg fccaggaacgt tgaaggaccg agaaagggtg acgattgatc aggaccgctg 7380 
ccggagcgca acccactcac tacagcagag ccatgtagac aacatcccct ccccctttcc 7440 
' accgcgtcag acgcccgtag cagcccgcta cgggcttttt catgccctgc cctagcgtcc 7500 
aagcctcacg gccgcgctcg gcctctctgg cggccttctg gcgctcttcc gcttcctcgc 7560 
tcactgactc gctgcgctcg gtcgttcggc tgcggogagc ggtatcagct cactcaaagg 7620 
cggtaatacg gttatccaca ^ca gg aa.g.acatg taagcaaaag 7680 

gccagcaaaa ggccaggaac cgtaaaaagg ccgcgttgct ggogtttttc cataggctcc 7740 
gcccccctga cgagcatcac aaaaatcgac gctcaagtca gaggtggcga aacccgacag 7800 
gactataaag ataccaggcg tttccccctg gaagctccct cgtgcgctct cctgttccga 7860 
ccctgccgct taccggatac ctgtccgcct ttetoootto gggaagcgtg gcgcttttcc 7920 
gctgcataac cctgcttcgg ggtcattata gcgatttttt cggtatatcc atcctttttc 7980 
gcacgatata caggattttg ccaaagggtt cgtgtagact ttccttggtg tatccaacgg 8040 
cgtcagccgg gcaggatagg tgaagtaggc ™c g a mgbgt** c^fcfccact 8100 
gtcccttatt cgcacctggc ggtgctcaac gggaatcctg ctctgcgagg ctggccggct 3160 
accaccggcg taacagatga gggcaagcgg atggctgatg aaaccaagcc aaccaggaag 8220 
ggcagcccac ctatcaaggt gtactgcctt ccagacgaac gaagagcgat tgaggaaaag 8280 
gcggcggcgg ccggcatgag cctgtcggcc tacctgctgg ccgtcggcca gggctacaaa 8340 
atcacgggog tcgtggacta tgagcacgtc cgcgagctgg cccgcatcaa tggcgacctg 8400 
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ggccgcctgg gcggccfcgct gaaactctgg ctcaccgacg acccgcgcac ggcgcggttc 8460 

ggcgatgcca cgatcctcgc cctgctggcg aagatogaag agaagwgga cgagettggc 8520 

aaggtcatga tgggcgtggt ccgcccgagg gcagagccat gactttttta gccgctaaaa 8580 

cggccggggg gtgcgcgtga ttgccaagca cgtccccatg cgctccatca agaagagcga 8640 

cttcgcggag ctggtgaagt acatcaccga cgagcaaggc aagaccgagc gcctttgcga 8700 

cgctcaccgg gctggttgcc ctcgccgctg ggctggcggc cgtctatggc cctgcaaacg 8760 

cgccagaaac gccgtcgaag ccgtgtgcga gacaccgcgg ccgccggcgt tgtggatacc 8820 

tcgcggaaaa cttggccctc actgacagat gaggggcgga cgbtgacacfc tgaggggccg 8880 

actcacccgg cgcggcgttg acagatgagg ggcagyutcg afctfccggccg gcgaagfcgga 8940 

gctggccagc ctcgcaaatc ggcgaaaacg cctgatttta cgcgagtttc ccacagatga 9000 

tgtggacaag cctggggata agtgccctgc ggtattgaca cttgaggggc gcgactactg 9060 

acagatgagg ggcgcgatcc ttgacacttg aggggcagag tgctgacaga tgaggggcgc 9120 

acctattgac atttgagggg ctgtccacag gcagaaaatc cagcatttgc aagggtttcc 9180 

gccegttttt cggccaccgc taacctgtct tttaacctgc ttttaaacca atatttataa 9240 

accttgtttt taaccagggc tgcgccctgt gcgcgtgacc gcgcacgccg aaggggggtg 9300 

cccccccttc tcgaaccctc ccggcccgct aacgcgggcc tcccatc^ c Ca ggggcfc g 93 60 

cgcccctcgg ccgcgaacgg cctcacccca aaaatggcag cgctggcagt ccttgccatt 9420 

gccsggatcg gggcagtaac gggatgggcg atcagcccga gcgcgacgcc cggaagcatt 9480 

gacgtgccgc aggtgcfcggc atcgacattc agcgaccagg tgccgggcag tgagggcggc 9540 

ggcctgggtg gcggwfcgcc ctb^cttcg gccgtcgggg catfccacgga cttcatggccj 9600 
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gggccggcaa tttttacctt gggcattctt ggcatagtgg tcgcgggtgc cgtgctcgtg 9660 
ttcgggggtg cgataaaccc agcgaaccat ttgaggtgat aggtaagatt ataccgaggt 9720 
atgaaaacga gaattggacc tttacagaat tactctatga agcgccatat ttaaaaagct 9780 
accaagacga agaggatgaa gaggatgagg aggcagafctg ccttgaatat attga C a a ta 9840 
ctgataagat aatafcatctt ttatatagaa gatatcgccg tatgtaagga ttt ca gHgy g 9300 
caaggcatag gcagcgcgct tatcaatata tctatagaat gggcaaagca taaaaactfcg 9960 
catggacto t^ottfl— ecaacracaat aaccttatag cttgtaaatt ctatcataat 1O020 
tgggtaatga ctccaactta ttgatagtgt tttatgttca gataatgccc gatgactttg 10080 
tcatgcagct ccaccgattt tgagaacgac ag.gacttcc gtcccagccg tgccaggtgc 10140 
tgcctcagat tcaggttatg ccgctcaatt cgctgcgtat atcgcttgct gattacgtgc 10200 
agctttccct tcaggcggga ttcatacagc ggocagccat ccgtcatcca tatcaccacg 10260 
tcaaagggtg acagcaggct cataagacgc cccagcgtcg ocatagtgcg ttcaccgaat 10320 
acgtgcgcaa caaccgtctt ccggagactg tcataogcgt aaaacagcca gcgctggcgc 10380 
gatttagccc cg^c -t^, tccafcttccg cgcagacgat gacgtcactg 10440 
cccggctgta tgcgcgaggt taccgactgc ggcctgagtt ttttaagtga cgtaaaatcg 10500 
tgttgaggoc aacgcccata atgcgggctg ttgcccggca tccaacgcca ttcatggcca 10560 
tatcaatgat tttctggtgc gtaccgggtt gagaagcggt gtaagtgaac tgcagttgcc 10620 
atgttttacg gcagtgagag cagagafcagc gctgatgtcc ggcggtgctt ttgccgttac 10680 
gcaccacccc gtcagtagct gaacaggagg gacagctgat agacacagaa gccactggag 10740 
cacctcaaaa acaccatcat acactaaatc agtaagttgg cagcatcacc cataattgtg 10800 
gtttcaaaat cggctcogte gat.ctatgt etttcraaaac aactttgaaa 10860 
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aagctgtttt ctg.tattta aggttttaga atgcaaggaa cagtgaattg gagttcgtct 10920 
tgttataatt agcttcttgg ggtatcttta aatactgtag aaaagaggaa ggaaataata 10980 
aatggctaaa atgagaatat caccggaatt gaaaaaactg atcgaaaaat accgctgcgt 11040 
aaaagatacg gaaggaatgt ctcctgctaa ggtatataag ctggtgggag aaaatgaaaa 11100 
cctatattta aaaatgacgg acagccggta taaagggacc acctatgatg tggaacggg* 11160 
aaaggacatg atgctatgg* tggaaggaaa gctgcctgtt ccaaaggtcc tgcactttga 11220 
acggca^t gg c tggagca ******* aagtgaggcc gatggcgtcc tttgctcgga 11280 
aga gtatgaa gatgaacaaa gccctgaaaa g attatcgag ctgtatgcgg agtgcatcag 11340 
gc tctttcac tccatcgaca tatoggattg tccctatacg aatagcttag acagccgctt 11400 
agccgaattg gattacttac tgaataacga tctggccgat gtggattgcg aaaactggga 11460 
agaagacact ccatttaaag atccgcgcga gctgtatgat tttttaaaga cggaaaagcc 11520 
cgaagaggaa cttgtctttt cccacggcga octgggagac agcaacatct ttgtgaaaga 11580 
tggcaaagta agtggcttta ttgatcttgg gagaagcggc agggcggaca agtggtatga 11640 
cattgccttc t gcgtu Cggt = g afcc aggg a DB .t~t« B a gaagaacagt atgtcgagct 11700 
attttttgac ttactgggga tcaagcctga ttgggagaaa ataaaatatt atattttact 11760 
ggatgaattg ttttagtacc tagatgtggc gcaacgatgc cggcgacaag caggagcgca 11820 
ccgacttctt ccg.atcaag tgttttggct ctcaggccga ggcccacggc aagtatttgg 11880 
gcaaggggtc gctggtattc gtgcagggca agattcggaa taccaagtac gagaaggacg 11940 
gccagacggt ctacgggacc gacttcattg ccgataaggt ggattatctg gacaccaagg 12000 
caccaggcgg gtcaaatcag gaataagggc acattgcccc ggcgtgagtc ggggcaatcc 12060 
cgcaaggagg gtgaatgaat cgg^tt* «*W ^-^caa saactgatcg 12120 
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acgcggggtt ttccgccgag gatgccgaaa ccatcgcaag ccgoaccgtc atgcgtgcgc 12180 
occgcgaaac cttccagtcc gtcggctcga tggtccagca agctacggcc aagatcgagc 12240 
gcgacagcgt gcaactggct ccccctgccc tgcccgcgcc atcggccgcc gtggagcgtt 12300 
cgcgtcgtct cgaacaggag gcggcaggtt tggcgaagtc gatgaccatc gacacgcgag 12360 
gaactatgac gaccaagaag cgaaaaacog ccggcgagga cctggcaaaa caggtcagcg 12420 
aggccaagca ggccgcgttg ctgaaacaca cgaagcagca gatcaaggaa atgcagcttt 12480 
ccttgttcg* tattgcgocg tggccggaca cgatgcgagc gatgccaaac gacacggccc 12540 
gctctgccct gttcaccacg cgcaacaaga aaatcccgcg cgaggcgctg caaaacaagg 12600 
tcattttcca cgtcaacaag gacgtgaaga tcacctacac cggcgtcgag ctgcgggccg 12660 
acgatgacga actggtgtgg cagcaggtgt tggagtacgc gaagcgcacc cctatcggcg 12720 
agccgatcac cttcacgttc tacgagcttt gccaggacct gggctggtcg atcaatggcc 12780 
ggtattacac gaaggccgag gaatgcctgt cgcgcctaca ggcgacggcg atgggcttca 12840 
cgtccgaccg cgttgggcac ctggaatcgg tgtcgctgct gcaccgcttc cgcgtcctgg 12900 
accgtggcaa g«»cgtc« c^ttgcoagg tcnhgatoga cgaggaaatc gtcgtgctgt 12960 
ttgctggoga ocactacacg aaa^tcatat gggagaagta ccgcaagctg tcgccgacgg 13020 
cccgacggat gttcgactat ttcagctcgc accgggagcc gtacccgctc aagctggaaa 13080 
ccttccgcct catgtgcgga tcggattcca cccgcgtgaa gaagtggcgc gagcaggtcg 13140 
gcgaagcctg cgaagagttg cgaggcagcg gcctggtgga acacgcctgg gtcaatgatg 13200 
acctggtgca ttgcaaacgc tagggccttg tggggtcagt tccggctggg ggttcagcag 13260 
ccagcgcttt actggcattt caggaacaag cgggcactgc tcgacgcact tgcttcgctc 13320 
agtatcgctc gggacgcacg ^cyctct, oguofamr aOa-auno gattaaaatt 13380 
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gacaattgtg attaaggctc agattcgacg gcttggagcg gccgacgfcgc aggatttccg 13440 
cgagatccga ttgtcggccc tgaagaaagc tccagagatg ttcgggtccg tttacgagca 13500 
cgaggagaaa aagcccatgg aggcgttcgc tgaacggttg cgagatgocg tggcattcgg 13560 
cgcctacatc gacggcgaga tcattgggct gtcggtcttc aaacaggagg acggccccaa 13620 
ggacgctcac aaggcgcatc tgtccggcgt tttcgtggag cccgaacagc gaggccgagg 13680 
g9 Lc SC cggt afcgctgctgc gggegtfcgcc goeooattta ttgctcgtga tgatcgtccg 13740 
acagattcca acgggaatct ggtggatgcg catcttcatc ctcggcgcac ttaatatttc 13800 
gctattctgg agcttgttgt ttatttcggt ctaccgcctg ccgggagggg tcgcggcgac 13860 
ggtaggcgct gtgcagccgc tgatggtcgt gttcatctct gccgctctgc taggtagccc 13920 
gatacgattg atggcggtcc tgggggcfcat ttgcggaact gcgggcgtgg cgctgttggt 13980 
gttgacacca aacgcagcgc tagatcctgt cggcgtcgca gcgggcctgg cgggggcggt 14040 
ttccatggcg ttcggaaccg tgctgacccg caagtggcaa cctcccgtgc ctctgctcac 14100 
ctttaccgcc tgge^tgg cggccggagg wttotflrte crttccagtag ctttagtgtt 14160 
tgatccgcca atcccgatgc ctacaggaac caatgttctc ggcctggcgt ggctcggcct 14220 
gatcggagcg ggtttaacct acttcctttg gttccggggg atctcgcgac tcgaacctac 14280 
agttgtttcc ttactgggct ttctcagccc cagatctggg gtcgatcagc cggggatgca 14340 
tcaggccgac agtcggaact tcgggtcccc gacctgtacc attcggtgag caatggatag 14400 
gggagttgat atcgtcaacg ttcacttcta aagaaatagc gccactcagc ttcctcagcg 14460 
gctttatcca gcgatttcct attatgtcgg catagttctc aagatcgaca gcctgtcacg 14520 
gttaagcgag aaatgaataa gaaggctg^ *attdgg a tc fcctgog^ger agatgatatt 14580 
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tgatcacagg cagcaacgct ctgtcatcgt tacaatcaac atgctaccct ccgcgagatc 14640 
atccgtgttt caaacccggc agcttagttg ccgttcttcc gaatagcatc ggtaacatga 14700 
gcaaagtctg ccgccttaca acggctctcc cgctgacgcc gtcccggact gatgggctgc 14760 
ctgtatcgag tggtgatttt gtgccgagct gccggtcggg gagctgtfcgg ctggctggtg- 14820 
gcaggatata ttgtggtgta aacaaattga cgcttagaca acttaataac acattgcgga 14880 
cgtttttaat gtactggggt ggtttttctt ttcaccagtg agacgggcaa cagctgattg 14940 
cccttcaccg octggccctg aaagagttffc aacaagcggt ccacgctggt ttgccccagc 15O00 
■ aggcgaaaat cctgtttgat ggtggttccg aaatcggcaa aatcccttat aaatcaaaag 15060 
aatagcccga gatagggttg agtgttgttc cagtttggaa caagagtcca ctattaaaga 15120 
acgtggactc caacgtcaaa gggcgaaaaa ccgtctatca gggcgatggc ccactacgtg 15180 
aaccatcacc caaatoaagt tttttggggt cgaggtgccg taaagcacta aatcggaacc 15240 
ctaaagggag cccccgattt agagcttgac ggggaaagcc ggcgaacgfcg gcgagaaagg 15300 
aagggaagaa agcgaaagga gcgggcgcca ttcaggctgc gcaactgttg ggaagggcga 15360 
tcggtgcggg cctcttcgcfc attacgccag ctggcgaaag gggaatgtgc tgcaaggcga 15420 
ttaagttggg taacgccagg gttttcccag tcacgacgtt gtaaaacgac ggccagtgaa 15480 
ttcgagctcg gtacccgggg atctttcgac actgaaatac gtcgagcctg ctccgcttgg 15540 
aagcggcgag gsgcctcgtc ctgtcacaac taccaacatg gagtacgata agggccagtt 15600 
ccgccagctc attaagagcc agttcatggg cgttggcatg atggccgtca tgcatctgta 15660 
cttcaagtac accaacgctc ttctgatcca gtcgatcatc cgctgaaggc gctttcgaat 15720 
ctggttaaga tccacgtctt cgggaagcca gcgactggtg acctccagcg tccctttaag 15780 
gctgccaaca gctttctcag ccctyggcoag cccaagaccg acraaggectfi cctccagaac 
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gccgagaaga actggagggg tggtgtcaag gaggagtaag ctccttattg aagtcggagg 15900 
acggagcggt gtcaagagga tattcttcga ctctgtatta tagataagat gatgaggaat 15960 
tggaggtagc atagcttcat ttggatttgc tttccaggct gagactctag cttggagcat 16020 
agagggtcct ttggctttca atattctcaa gtatctcgag tttgaactta ttccctgtga 16080 
accttttatt caccaatgag cattggaatg aacatgaatc tgaggactgc a^gccatcf 16140 
aggttttcga aatacatccg gatgtcgaag gcttggggca cctgcgttgg ttgaatttag 16200 
aacgt.gr.ac tattcratcat ccgatagctc tgcaaagggc gttgcacaat gcaagtcaaa 16260 
cgttgctagc agttccaggt ggaatgttat gatgagcatt gtattaaatc aggagatata 16320 
gcatgatctc tagttagctc accacaaaag tcagacggcg taaccaaaag tcacacaaca 16380 
caagctgtaa ggatttcggc acggctacgg aagacggaga agccaccttc agtggactcg 16440 
agtaccattt aattctattt gtgtttgatc gagacctaat acagccccta caacgaccat 16500 
caaagtcgta tagctaccag tgaggaagtg gactcaaatc gacttcagca acatctoctg 16560 
gataaacttt aagcctaaac tatacagaat aagataggtg gagagcttat accgagctcc 16620 
c6aatct gtc cagatc.t-.gg ttgacccratg cctggatctt cctatagaat catccttatt 16680 
cgttgaccta gctgattctg gagtgaccca gagggtcatg acttgagcct aaaatccgcc 16740 
gcctccacca tttgtagaaa aatgtgacga actcgtgagc tctgtacagt gaccggtgac 16800 
tctttctggc atgcggagag acggacggac gcagagagaa gggctgagta ataagccact 16860 
ggccagacag ctctggcggo tctgaggtgc agtggatgat tattaatccg ggaccggccg 16920 
cccctccgcc ccgaagtgga aaggctggtg tgcccctcgt tgaccaagaa fcctattgcat 16980 
catcggagaa tatggagctt catcgaatca ccggcagtaa gcgaaggaga atgtgaagcc 17040 
aggggtgtot agccgtcggc gaa a ta gc a fc gccattaacc taggtacaga agtccaattg 17100 
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cttccgatct ggtaaaagat tcacgagata gtaccttctc cgaagtaggt agagcgagta 17160 
cccggcgcgt aagctcccta atfcggcccat ccggcatctg tagggcgtcc aaatatcgtg 

.cctctccfcgc tttgcccggt gtatgaaacc ggaaaggccg ctcaggagct ggccagcggc 
gcagaccggg aacacaagct ggcagtcgac ccatccggtg ctctgcactc gacctgctga 17340 
ggtccctcag tccctggtag gcagctttgc cccgtctgtc cgcccggtgt gtcggcgggg 17400 
ttgacaaggt cgttgcgtca gtccaacatt tgttgccata ttttcctgct ctccccacca 17460 
gctgctcttt tcttttctct ttcttttccc atcttcagta tattcatctt cccatccaag 17520 
aacctttatt tcccctaagt aagtactttg ctacatccat actccatcct tcccatccct 17580 
tattcctttg aacctttcag ttcgagcttt cccactt^aL cgcagcttga. ctaacagcta 17640 
ccccgcttga gcagacatca ccafcgcctga actcaccgcg acgtctgtcg agaagtttct 17700 
gatcgaaaag ttcgacagcg tctccgacct gatgcagctc tcggagggcg aagaatctcg 17760 
tgctttcagc ttcgatgtag gagggcgtgg atatgtcctg cgggtaaata gctgcgocga 17820 
tggtttctac aaagatcgtt atgtttatcg gcactttgca tcggccgcgc tcccgattcc 17880 
ggaagtgctt gacattgggg aattcagcga gagcctgacc tatfcgcatct cccgccgtgc 17940 
acagggtgtc acgttgcaag acctgcctga aaccgaactg cccgctgttc tgcagccggt 18000 
cgcggaggcc atggatgcga tcgctgcggc cgatcttagc cagacgagcg ggttcggu 
attcggaccg caaggaatcg gtcaatacac tacatggcgt gatttcatat gcgcgattgc 18 
tcratccccat gtgtatcact ggcaaactgt gatggacgac accgtcagtg cgtccgtcgc 
gcaggctctc gatgagctga tgctttgggc cgaggactgc cccgaagtcc ggcacctcgt 18240 
gcacgcggat ttcggctcca acaatgtcct gacggacaat ggccgcataa cagcggtcat 18300 
tgactggagc gaggcgatgt tcggggattc ccaatacgag gtcgccaaca tcttettctg 18360 
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gaggccgtgg ttggcthgta tggagcagca gacgcgctac ttcgagcgga ggcatccgga 18420 
gcttgcagga tcguugcygc tccgggcgfca tatgctocgc attggtefefcg acmactcta 18480 
tcagagcttg gttgacggca atttcgatga tgcagcttgg gcgcagggtc gatgcgacgc 18540 
aatcgtccga tccggagccg ggactgtcgg gcgtacacaa atcgcccgca gaagcgcggc 18600 
cgtctggacc gatggctgtg tagaagtact cgccgatagt ggaaaccgac gccccagcac 18660 
tcgtccgagg gcaaaggaat agagtagatg ccgaccgcgg gatcgatcca cttaacgtta 18720 
ctgaaatcat caaacagctt gacgaatctg gatataagat cgttggtgtc gatgtcagct 18780 
ccggagttga gacaaatggt gttcaggatc tcgataagat acgttcattt gtccaagcag 18840 
caaagagfcgc cttctagtga tttaatagct c^Lgtcaac wgnataaaa cgcgtttfcag 18900 
ggtttacctc ttccagatac agctcatctg caatgcatta afcgcattgac tgcaacctag 18960 
taaogccttn caggctccgg cgaagagaag aatagcttag cagagctatt ttcattttcg 19020 
ggagacgaga tcaagcagat caacggtcgt caagagacct acgagactga ggaatccgct 19080 
cttggctcca cgcgactata tatttgtctc taattgtact ttgacatgct cctcttcttt 19140 
actctgatag cttgactatg aaaattccgt caccagcncc tgggttcgca aagataattg 19200 
catgtttctt ccttgaactc tcaagcctac aggacacaca ttcatcgtag gtataaacct 19260 
cgaaatcant tcctactaag atggtataca atagtaacca tgcatggtLg cctagbgaat 19320 
gctccgtaac acccaatacg ccggccgaaa cttttttaca actctcctat gagtcgttta 19380 
cccagaatgc acaggtacac ttgtttagag gtaatccttc tttctagcta gaagtcctcg 19440 
tgtactgtgt aagcgcccac tccacatctc cactcgacct gcaggcatgc a 19491 
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<212> DMA 

<213> Artificial 



<223> Plasmid 



<220> 

<221> misc„feature 

<222> (3471) ..(3471) 

<223> n is a, c, g, or t 

<.220> 

<221> iaisc_feature 

<222> (3679) .-(3679) 

<223> ii is a, c, g, or t 

<220> 

<221> misc_feature 

<222> (3770) .. (3770) 

<223> n is a, c, g, or t 

<400> 46 

gatctttcga cactgaaata cgtcgagcct gctccgcttg gaagcggcga ggagcctcgt 60 

cctgtcacaa ctaccaacat ggagtacgat aagggccagt tccgccagct cattaagagc 120 

cagttcatgg gcgttggcat gatggccgtc atgcatctgt acttcaagta caccaacgct 180 

cttctgatcc agtcgatcat ccgctgaagg cgctttcgaa tctggttaag atccacgtct 240 

tcgggaagcc agcgactggt gacctccagc gtccctttaa ggatgccaac agctttcfcca 300 

gccagggcca gcccaagacc gacaaggcct ccctccagaa cgccgagaag aactggaggg 360 

gtsatgtcaa ggaggagtaa gctccttatt gaagtcggag gacggagcgg tgtcaagagg 420 

atattettcg actctgtatt atagataaga tgatgaggaa ttggaggtag catagcttca 480 

tttggatttg ctttccaggc tgagactcta gcttggagca tagagggtcc tttggctttc 540 

aatattctca agfcatctcga gtttgaactt attccctgtg aaccttttat tcaccaatga 600 
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gcattggaat gaacatgaat ctgaggactg caatcgccat gaggttttcg aaatacatcc 660 

ggatgtcgaa ggcttggggc acctgcgttg gtfcgaattta gaacgtgcxca ctafctgatca 720 

tccgatagct ctgcaaaggg cgttgcacaa tgcaagtcaa acgttgctag cagttccagg 780 

tggaatgtta tgatgagcat tgtattaaat caggagatat agcatgatct ctagttagct 840 

caccacaaaa gtcagacggc gtaaccaaaa gtcacacaac acaagctgta aggatttcgg 900 

cacggctacg gaagacggag aagccacctt cagtggactc gagtaccatt taattctatt 960 

tgtgtttgat cgagacctaa tacagcccch acaacgacca tcaaagtcgt atagctacca 1020 

gtgaggaagt ggactcaaat cgacttcagc aacatctcct ggataaactt taagcctaaa 1080 

ctafcacagaa taagataggt ggagagctta t^ccgagcfcc ccaaatctgt ccagatcatg 1140 

gttgaccggt gcctggatct tcctatagaa tcatccttat tcgttgacct agctgattct 1200 

ggagtgaccc agagggtcat gacttgagcc taaaatccgc cgcctccacc atttgtagaa 1260 

aaatgtgacg aactcgtgag ctctgtacag tgaccggtga ctctttctgg catgcggaga 1320 

gacggacgga cgcagagaga agggctgagt aataagccac bggccagaca gctcfcggcgg 1380 

ctctgaggtg cag fc g gatga ttattaatcc gggaccggcc gcccctccgc cccgaagtgg 1440 

aaaggctggt gtgcccctcg ttgaccaaga atctattgca tcatcggaga atatggagct 1500 

tcatcgaatc accggcagta agcgaaggag aatgtgaagc cag3 ggtgt* fcagccgfccgg X5S0 

cgaaatagca tgccattaac ctaggtacag aagtccaafct gcttccgatc tggtaaaaga 1620 
tteacaaoat aatacctfcct ccgaagfcagg tagagcgagt acccggcgcg taagctccct 1680 
aattggcnca tccggcatct gtagggcgtc caaatatcgt gcctctcctg ctttgcccgg 1740 
tgtatgaaac cggaaaggcc gctcaggagc tggccagcgg cgcagaccgg gaacacaagc 1800 
tggcagtcga cccatccggt gctctgcact cgacctgctg aggtccctca gtccctggta 1860 
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ggcagctttg ccccgtctgt ccgcccggtg tgtcggcggg gttgacaagg tcgttgcgtc 1920 

agtccaacat ttgttgccat attt-Uccbgc tctccccaco agctgctett ttctttfccfcr. 1980 

tttcttttcc catcttcagt atattcatct tcccatccaa gaacctttat ttcccctaag 2040 

taagtacttt gctacatcca tactccatcc ttcccatccc ttattccttt gaacctttca 2100 

gttcgagctt tcccacttca tcgcagcttg actaacagct accccgcttg agcagacatc 2160 

accatgcctg aactcaccgc gacgtctgtc gagaagttfcc tgatcgaaaa gttcgacagc 2220 

gtctccgacc tgatgcagct ctcggagggc gaagaatctc gtgctttcag cttcgatgta 2280 

ggagggcgtg gatatgtcct gcgggtaaat agctgcgccg atggtttcta caaagatcgt 2340 

tatgtttatc ggcactttgc atcggccgcg cccccgattc cggaagtgct tgacafctggg 2400 

gaattcagcg agagcctgac ctattgcatc tcccgccgtg cacagggtgt cacgttgcaa 2460 

gacctgcctg aaaccgaact gcccgctgtt ctgcagccgg tcgcggaggc catggatgcg 2520 

atcgctgcgg ccgatcttag ccagacgagc gggttcggcc cattcggacc gcaaggaatc 2580 

ggbcaataca ctacatggcg tgatttcata tgcgcgattg ctgatcccca tgtgtatcac 2640 

tggcaaactg tgatggacga caccgtcagt gcgtccgtcg cgcaggctct cgatgagctg 2700 

atgctttggg ccgaggactg ccccgaagtc cggcacctcg tgcacgcgga tttcggctcc 2760 

aacaatgtcc tgacggacaa tggccgcata acagcggtca ttgactggag cgaggcgaLg 2 820 

ttcggggatt cccaatacga ggtcgccaac atcttcttct ggaggccgtg gttggcttgt 2880 

atggagcagc aaaccjcgcta cttcgagcgg aggcatccgg agcttgcagg atcgccgcgg 2940 

ctccgggcgt atatgctccg cattggtctt gaccaactct atcagagctt ggttgacggc 3000 

aatttcgatg atgcagcttg ggcgcagggt cgatgcgacg caatcgtccg atccggagcc 3060 

gggactgtcg ggcgtacaca aatcgcccgc agaagcgcgg ccgtctggac cgatggctgt 3120 
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gtagaagtac tcgccgatag tggaaaccga cgccccagca ctcgtccgag ggcaaaggaa 3180 

tetgagtagat gccgaccgog ggatcgat.ee acfctaacgtt actgaaafcea tcaaacagct 3240 

tgacgaatct ggatataaga tcgttggtgt cgatgtcagc tccggagttg agacaaatgg 3300 

tgttcaggat ctcgataaga tacgttcatt tgtccaagca gcaaagagfcg ccttctagtg 3360 

atttaatagc tccatgtcaa caagaataaa aegegtttte gggfcttacct cttccagata 3420 

cagctaatct geaatgeatt aatgcattga ctgeaaecta gtaaegcett ncaggctccg 3480 

gcgaagagaa gaatagctta gcagagctat tttcattttc gggagacgag atcaagcaga 3540 

teaaeggteg tcaagagacc tacgagactg aggaatcege tcttggctcc aegegactat 3600 

atatttgfcct ctaattgtac; tttgacatgc fecctcttafct tactctgata .gchfcgacfcat 3660 

gaaaattccg tcaccagcnc ctgggttcgc aaagataafct gcatgtttct tccttgaact 3720 

ctcaagccta caggacacac attcategta ggtataaacc tcgaaatcan ttcctactaa 37 80 

gatggtatac aatagtaacc atgcatggtt gcctagtgaa tgctccgtaa cacccaatac 3 840 

geeggoogaa aehtfcfcttac aactctccta tgagtcgttt acccagaatg cacaggtaca 3900 

cttgtttaga ggtaatcctt ctttctagct agaagtcctc gtgtactgtg taagcgccca 3960 

ctccacatct ccactcgacc tgcaggcatg caagcttgaa ttcgagctcg gtacccgggg 4020 

atctttcgac actgaaatac gtcgagcctg ctccgcttgg aageggegag gagcctcgtc 4080 

ctgtcacaac taccaacatg gagtacgata agggecagtt ccgccagctc attaagagee 4140 

■ agttcatggg cgttggcatg atggccgtca tgcatctgta cttcaagtac accaacgctc 4200 

ttctgatcca gtcgatcatc egctgaagge gctttcgaat ctggttaaga tccacgtctt. 4260 

egggwgeca gcgacfcggtg acctccagcg tceetttaag gctgccaaca gctttctcag 4320 
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tggtgtcaag gaggagtaag ctccttattg aagtcggagg acggagcggt gtcaagagga 
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ccagggccag cccaagaccg t 

4440 



tattcttcga ctctgtatta tagataagat gatgaggaat; tggaggtagc atagcfctcat 
ttggatttgc tttccaggct gagactctag cttggagcat agagggtcct ttggctttca 4560 
atattctcaa gtatctcgag tttgaactta ttccctgtga «otttutt o^tutOT ^20 
cattggaatg aacatgaatc tgaggactgc aatcgccatg aggttttcga aatacatccg 4680 
ga t gtcg aa g ocfctowaca cctgcgttgg ttgaatttag aacgtggcac tattgatcat 4740 
ccgatagctc tgcaaagggc gttgcacaat gcaagtcaaa cgttgctagc agttccaggt 4800 
ggaatgttat gatgagcatt gtattaaatc aggagatata gcatgatctc tagttagctc 4860 
accacaaaag tcagacggcg taaccaaaag tcacacaaca caagctgtaa ggatttcggc 4S20 
acggctacgg aagacggaga agccaccttc agtggactcg agtaccattt aattctattt 4980 
gtgtttgatc gagacctaat acagccccta caacgaccat caaagtcgta t agctac:.« g 5040 
tgaggaagtg gactcaaatc gacttcagca acatctcctg gataaaottt aagcctaaac 5100 
urt^ a«t g ga gaacttat accgagctcc caaatctgtc cagatcatgg 5160 
ttgaccggtg cctggatctt cctatagaat catccttatt cgttgaccta gctgattctg 5220 
gagtgaccca gagggtcatg acttgagcct aaaatccgcc gcctccacca tttgtagaaa 5280 
aatgtgacga actcgtgagc tctgtacagt gaccggtgac tcfcttctggc atgcggagag 5340 
acggacggac gcagagagaa gggctgagta ataagccact ggccagacag ctctggcggc 5400 
tctgaggtgc agtggatgat tattaatcog ggaccggccg eccctccgcc ccgaagtgga 5460 
aaggctggtg tgcccctcgt tgaccaagaa fcctattgcat catcggagaa tatggagctt 5520 
catcgaatc, cc^taa ^aag^ atcrteaaacc aggggtgtat agccgtcggc 5580 
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gaaatagcat gccattaacc taggtacaga agtccaattg cttccgatct ggtaaaagat B640 
tcacgagata gtaccttctc cgaagtaggt agagcgagta cccggcgcgt aagctcccta 5700 
attggcccat ccggcatctg tagggcgtcc aaatatcgtg cetctcctgc tttgcccggt 5760 
gtatgaaacc ggaaaggccg ctcaggagct ggccagcggc gcagaccggg aacacaagct 5820 
ggcagtcgac ccatccggtg ctctgcactc gacctgctga ggtcc^.ag ^ 
gcagctttgc cccgtctgtc cgcccggtgt gtcggcgggg ttgacaaggt cgttgcgtca 5940 
gtccaaoatt t^^ata ttttcotBOt ctcccacca gctgctcttt tcttttctct 6000 
ttcttttccc atcttcagta tattcatctt cccatccaag aacctttatt tcccctaagt 5060 
aagtactttg ctacatccat actccatcct tcccatccct tattcctttg aacctttcag 6120 
ttcgagcttt cccacttcat cgcagcttga ctaacagcta ccccgcttga gcagacatca 6180 
ccatgtcaat actcacttat ctggaatttc atctctacta tacactacct gtccttgcgg 6240 
cattgtgttg gctgctaaag ccgtttcaot cacagcaaga caatctcaag tataaat^ 6300 
taatgttgat ggccgcctct accgcatcga tttgggacaa ttatatcgtt tatcatcgcg 6360 
cmtggt^ c^cataot tofcottotoa ctgtcattgg ctatgtacct ctagaagaat 6420 
acatgttctt tatcatcatg actttaatga ctgtcgcgtt ctcaaacttt gttatgcgtt 6480 
ggcacttgca tactttcttt attagaccca acacttcttg gaagcaaaca ctattagtac 6540 
gccttgtgcc tgtttcagcfc ttattggcaa tcacttatca tgcttggcac ttgacactgc 6600 
caaataaacc ttcattttat ggttcatgca tcctttggta tgcttgtcct gtgttggcta 6660 
ttctttggct gggtgctggc gaatatatct tgcgtcgacc tgtggctgtc cttttgtc.a ,720 
ttgttatccc tagtgtatac ctatgttggg ctgatatcgt cgctattagt gctggcacat 67B0 
' ggcatat^c tott—* ^toot-at acccgattta cctgtagaag 6840 
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2: 

aatgcctgtt ttttactttg atcaacacag 
gcgctcaggc catcctccat gtgagcgcgc 
gctccaccgc ggtggcggcc gctctagaac 
cacgagctac atttcacaag cccgtgagcg 
ctcctcatct ccatcggtca tttgctgcfca 
gcgtcaaggc ccgccgcgtt gaactagccc 
atgctcagcg gtgctcgtta gttcggcfcgc 
tgggaaccgt gcaggctgcc ggcgcgggcg 
agcttgaccg ggctatcgca gagcgtcgtg 
aggctgccgc cattgcagca tcaattggcg 
tgagatttgc catgcacatg accgtgggcg 
ctctcctctt ggtggttggt ggcgcgctcg 

aagccatctg gcatgagtcg cctctgggct 
gcactggacc ctttgaagcc aacgacttgt 
tcctgtgtac ctttggcttc tggctgccca 
ggctgggcat cacgctatac ggcafcggcafc 
ggcgctttcc caccgggccc atcgctggcc 
accagctaca ccacagcggc aagtacggtg 
aggagctgca gcacattcca ggtgcggcgg 
actggtccaa gcgggctcag gccatcctcc 
accctaaaca agccatttcc cttttccagc 
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tcttggtttt tgctacctgt gctatagacc 6900 

gtaatacgac tcactatagg gcgaattgga 6960 

tagtggatcc cccgggctgc aggaattcgg 7020 

gtgcaagcgc tctgccccac atcggcccac 7080 

ccacgatgct gtcgaagctg cagtcaatca 7140 

gcgacatcac gcggcccaaa gtctgcctgc 7200 

gagtggcagc accacagaca gaggaggcgc 7260 

atgagcacag cgccgafcgta gcactccagc 7320 

cccggcgcaa acgggagcag ctgtcatacc 7380 

tgtcaggcat tgccatcttc gccacctacc 7440 

gcgcagtgcc atggggfcgaa gtggctggca 7500 

gcatggagat gtatgcccgc tatgcacaca 7560 

ggctgctgca caagagccac cacacacctc 7620 

ttgcaatcat caatggactg cccgccatgc 7680 

acgtcctggg ggcggcctgc tttggagcgg. 7740 

atstgttfcgt acacgatggc ctggtg'caca 7 800 

tgccctacat gaagcgcctg acagtggccc 7860 

gcgcgccctg gggtatgttc ttgggtccac 7920 

aggaggtgga gcgactggtc ctggaactgg 7980 

atctgtacaa atcatctgtt caaaatcaaa 8040 

atgtcaaaga gctagcatgg gccttctgtc 8100 
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ttcctgacca aatgctcaac aatgaatfcgt btgatgatct tactatcagc tgggatattt 8160 
tacgtaaagc ctcaaagtw t t ctat acfcg catctgccgh fc t f.hccas ff <, tatgtacgtc 8220 
aagacttggg tgttctctat gctttctgca gagctaccga tgacctgtgc gatgatgaat 8280 
ccaaatctgt tcaagaaaga agagaccaat tagatcttac tcgacaattt gttcgtgatc 8340 
tctttagcca aaagaccagt gcgcctattg tgattgattg ggaattgtat caaaaccaac 8400 
ttcctgcttc ttgtatatca gcctttagag cctttactcg ccttcgccat gtcctfcgaag 8460 
tagaccctgt agaagaacta ttagatggtt acaaatggga tcttgagcgt cgtcctatcc 8520 
ttgatgaaca agacttggag gcatactctg cttgtgtggc cagtagtgtg ggtgaaatgt 8580 
gcacacgtgt gattcttgct caagaccaaa aggaciaatga fcgcttggata attgaccgfcg 8640 
cacgtgagat ggggctggtg ctacaatacg ttaacattgc tcgagacatt gtgactgata 8700 
gcgagactct gggtcgatgt tatctgcctc aacaatggct tagaaaagaa gaaacagaac 8760 
aaatacagca aggcaacgcc cgtagcctag gtgatcaaag actgttgggc ttgtctetga 882 0 
agcttgtagg aaaggcagac gctatcatgg tgagagctaa gaagggcatt gacaagttgc 8880 
cggcaaactg tcaaggcggt gtacgagctg cttgccaagt atatgctgca attggatctg 8940 
tactcaagca gcagaagaca acatatccta caagagctca tctaaaagga agcgaacgtg 9000 
ccaagattgc tctgttgagt gtatacaacc tctatcaatc tgaagacaag cctgtggcfco 9060 
tccgtcaagc tagaaagatt aagagttttt ttgttgatta gtgaattttt gttttattta 9120 
tOtctomtaa ttcaataaag agacaacaca tacaatataa aatcattgtc tttaaatgtt 9180 
aatttagtag agtgtaaagc ctgcattttt tttgtacgca taaacaatga gttcaccccg 9240 
cttctggttt ttaaataatt atgtcaaact agggaaaatt cttttttttc tcttogttct 9300 
ttttttggot tgttgtggag tcacaggctt gtcttcagat tgatagaggt tgtatacact 9360 
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caacagagca atcttggcac gttcgcttcc ttttagatga gctcttgtag gatatgttgt 9420 
cttctgctgc ttgagnacag atcc«fcfcsc agctataot fcggeaacrcaa ctcgtacacc 9480 
gccttgacag tttgccggca acttgtcaat gcccttctta gctctcacca tgafeagcgtc 9540 
tgcctttcct acaagcttgg cgtaatcatg gtcatagctg tttcctgtgt gaaattgtta 9600 
tccgctcaca attccacaca acatacgagc cggaagcata aagtgtaaag cctggggtgc 9660 
ctaatgagtg agctaactca cattaattgc gttgcgctca ctgcccgctt tccagtcggg 9720 
aaacctgtcg tgccagctgc attaatgaat cggccaacgc gcggggagag gcggtttgcg 9780 
tattgggcca aagacaaaag ggcgacattc aaccgattga gggagggaag gtaaatattg 9840 
acggaaatta ttcattaaag gtgaattatc accgtu^g actfcgagcoa httgggaatt 9900 
agagccagca aaatcaccag tagcaccatt accattagca aggccggaaa cgtcaccaat 9960 
gaaaccatcg atagcagcac cgtaatcagt agcgacagaa tcaagtttgc ctttagcgtc 10020 
agactgtagc gcgttttcat cggcattttc ggtcatagcc cccttattag cgtttgccat 10080 
cttttcataa tcaaaatcac cggaaccaga gccaccaccg gaaccgcctc cctcagagcc 10140 
gccaccctca gaaccgccac cctcagagcc accaccctca gagccgccac cagaaccacc 10200 
accagagccg ccgccagcat tgacaggagg cccgatctag taacatagat gacaccgcgc 10260 
gcgataattt atcctagttt gcgcgctata ttttgttWC tatuyugt^t t^tgtata 10320 
attgcgggac tctaatcata aaaacccatc tcataaataa cgtcatgcat tacatgttaa 10380 
ttBMb8 cttaacgtaa ttcaacagaa attatatgat aatcatcgca agaccggcaa 10440 
caggattcaa tcttaagaaa ctttattgcc aaatgtttga acgatcgggg atcatccggg 10500 
tcfcgfcggcgg ga actccacg aaaatatccg aacgcagcaa gatatcgcgg tgcatctcgg 10560 
tcttgcctgg gcagtcgccg ccgacgccgt tgatgtggac gccgggcccg atcatattgt 10620 
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10920 
10980 



11100 
11160 



cgctcaggat cgtggcgttg tgcttgtcgg ccgttgctgt cgtaatgata tcggcacctt 
cgaccgcctg ttccgcagag afcccogtggg cgaagaactc cagcatgana tccccgcgct 10740 
ggaggatcat ccagccggcg tcccggaaaa cgattccgaa gcccaacctt tcatagaagg 10800 
cggcggtgga atcgaaatct cgtgatggca ggttgggcgt cgcttggtcg gtcatttcga 10860 
accccagagt cccgctcaga agaactcgtc aagaaggcga tagaaggcga tgcgctgcga 
atcgggagcg gcgataccgt aaagcacgag gaagcggtca gcccattcgc cgccaagctc 
ttcagcaata tcacgggtag ccaacgctat gtcctgatag cggtccgcca cacccagccg 11040 
gccacagtcg atgaatccag aaaagcggcc attttccacc atgatattcg gcaagcaggc 
atcgccatgg gtcacgacget gatcatcgcc gfccgggcatg cgagccttga gcctggcgaa 
cagttcggct ggcgcgagcc cctgatgctc ttcgtccaga tcatcctgat cgacaagacc 11220 
ggcttccatc cgagtacgtg ctcgctogat gcgatgtttc gcttggtggt cgaatgggca 11280 
ggtagccgga tcaagcgtat gcagccgccg cattgcatca gccatgatgg atactttctc 11340 
ggcaggagca aggtgagatg acaggagatc ctgccccggc acttcgccca atagcagcca 11400 

gtcccttccc gcttcagtga caacgtcgag cacagctgcg caaggaacgc ccgtcgtggc 11460 

cagccacgafc agccgcgctg cctcgtcctg cagttcattc agggcaccgg acaggtcggt 11520 

cttgacaaaa agaaccgggc gcccctgcgc tgacagccgg aacacggcgg catcagagca 11580 

gccgattgtc tgttgtgccc agtcatagcc gaatagcctc tccaccaaag cggccggaga 11640 

acctgcgtgc aatccatctt gttcaatcat gcgaaacgat ccagatccgg tgcagattat 11700 

ttggattgag agtgaatatg agactctaat tggataccga ggggaattta tggaacgtca 11760 

gtggagcatt tttgacaaga aafcafcfctget agctcratagfc craccttaggc gacttttgaa 11820 
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cgcgcaataa tggfcttctga cgtatgtgct tagctcatta aactccagaa acccgcggct 11880 
gagtggctcc ttcaacgttg cggttctgtc agfctccaaac gtaaaacggc ttgtcccgcg 11940 
tcatcggcgg gggtcataac gtgactccct taattctccg ctcatgatca gattgtcgtt 12 
tcccgccttc agtttaaact atcagtgttt gacaggatat attggcgggt aaacctaaga 12 
gaaaagagcg tttattagaa taatcggata tttaaaaggg cgtgaaaagg tttatccgtt 12120 
cgtccatttg tatgtgcatg ccaaccacag ggttccccag atctggcgcc ggccagcgag 12180 
acgagcaaga ttggccgocg cccgaaacaa tccaacagcg cgcccagcac aggtgcgcag 12240 
gcaaattgca ccaacgcata cagcgccagc agaatgccat agtgggcggt gacgtcgttc 12300 
gagtgaacca gatcgcgcag gaggcccggc agcaccggca taatcaggcc gatgccgaca 12360 
gcgtcgagog cgacagtgct cagaattacg atcaggggta tgttgggttt cacgtctggc 12420 
ctccggacca gcctccgctg gtccgattga acgcgcggat tctttatcac tgataagttg 12480 
gtggacatat tatgtttatc agtgataaag tgtcaagcat gacaaagttg cagccgaata 
cagtgatccg tgccgccctg gacctgttga acgaggtcgg cgtagacggt ctgacgacac 12 
gcaaauLyyc gg aa cggttg ggggbtcagc ageaggngct ttactggcac ttcaggaaca 12660 
agcgggcgct gctcgacgca ctggccgaag ccatgctggc ggagaatcat acgcattcgg 12720 
tgccgagagc cgacgacgac tggcgctcat ttctgatcgg gaafcgcccgc agcttcaggc 12780 
aggcgctgct cgcctaccgc gatggcgcgc gcatccatgc cggcacgcga ccgggcgcac 12 840 
cgcagatgga aacggccgac gcgcagcttc gcttcctctg cgaggcgggt ttttcggccg 12900 
gggacgccgt caatgcgctg atgacaatca gctacttcac tgttggggcc gtgcttgagg 12960 
agcaggccgg cgacagcgat gccggcgagc gcggcggcac cgttgaacag gctccgctct 13020 
cgccgctgtt gcgggccg«g atcigacgccfc tcgaogaagc cggtoogg^c geagngttcg 13080 
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agcagggact cgcggtgatt gtcgatggat tggcgaaaag gaggctcgtt gtcaggaacg 13140 

ttgaaggacc gagaaagggt gacgattgat caggaccgct gccggagcgc aacccactca 13200 

ctacagcaga gccatgtaga caacatcccc tccccctttc cacogcgtca gacgcccgta 13260 

gcagcccgct acgggctttt fccatgccctg ccctagcgtc caagcctcac ggccgcgctc 13320 

ggcctctctg gcggccttct ggcgctcttc cgcttcctcg ctcactgact cgctgcgctc 13380 

ggtcgttcgg ctgcggcgag cggtatcagc tcactcaaag gcggtaatac ggttatccac 13440 

agaatcaaag gataacgcag gaaagaacat gtgagcaaaa ggccagcaaa aggccaggaa 13500 

ccgtaaaaag gccgcgttgc bggcgttttt ccataggctc cgcccccctg acgagcatca 13560 

caaaaatcga cgctcaagtc agaggtggcg aaacccgaca ggactataaa gataccaggc 13620 

gtttccccct ggaagctccc tcgtgcgctc tcctgttccg accctgccgc ttaccggata 13680 

cctgtccgcc tttctccctt cgggaagcgt ggcgcttttc cgctgcataa ccctgcttcg 13740 

gggtcattat agcgattttt tcggtatatc catccttttt cgcacgatat acaggatttt 13800 

gccaaagggt tcgtgtagac tttccfctggt gtatccaacg gcgtcagccg ggcaggatag 13860 

gtgaagtagg pnracccgcg agcgggtgtt ccttctfccac tgtcccttat tcgcacctgg 13920 

cggtgctcaa cgggaatcct gctctgcgag gctggccggc taccgccggc gtaacagatg 13980 

agggcaagcg gatggctgat gaaaccaagc caaccaggaa gggcagccca cctatcaagg 14040 

tgtactgcct tccagacgaa cgaagagcga ttgaggaaaa ggcggcggcg gccggcatga 14100 

gcctgtcggc ctacctgctg gccgtcggcc agggctacaa aatcacgggc gtcgtggact 14160 

atgagcacgt ccgcgagctg gcccgcatca atggcgacct gggccgcctg ggcggcctgc 14220 

tgaaactctg gctcaccgac gacccgcgca cggcgcggtt cggtgatgcc acgatcctcg 14280 

ccctgctggc gaagafcogaa gagaageagg aegagcttgg eaaggfceat-.g atgggcgtgg 14340 
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tccgcccgag ggcagagcca tgactttttt agccgctaaa aeggccgggg ggtgcgcgtg 14400 

attgc.caagc acgtccccat gcgctccatc aagaagagcg acttcgcgga gctggtgaag 14460 

tacatcaccg acgagcaagg caagaccgag cgcctttgcg acgctcaccg ggctggttgc 14520 

cctcgccgct gggctggcgg ccgtctatgg ccctgcaaac gcgccagaaa cgccgtcgaa 14580 

guugL-yty^g ctgacacogcg gccgccgggg tUy tygettac ctcgcggaaa auLLygccct 14640 

cactgacaga tgaggggcgg acgttgacac ttgaggggcc gactcacccg gcgcggcgtt 14700 

gacagatgag gggcaggctc gatttcggcc ggcgacgtgg agctggccag cctcgcaaat 14760 

cggcgaaaac gcctgatttt acgcgagttt cccacagatg atgtggacaa gcctggggat 14820 

aagtgccctg cggtattgac acttgagggg cgcgactact gacagatgag gggcgcgatc 14880 

cttgacactt gaggggcaga gtgctgacag atgaggggcg cacctattga catttgaggg 14940 

gctgtccaca ggcagaaaat ccagcatttg caagggtttc cgccegttfct tcggccaccg 15000 

cfcaacctgtc ttttaacctg cttttaaacc aatatttata aaccttgttt ttaaccaggg 15060 

ctgcgccctg tgcgcgtgac cgcgcacgcc gaaggggggt gccccccctt cfccgaaccct 15120 

cccggcccgc taacgcgggc ctcccatccc cccaggggct gcgcccctcg gccgcgaacg 15180 

gcctcacccc aaaaatggca gcgctggcag tccfctgccat tgccgggatc ggggcagtaa 15240 

cgggatgggc gatoagcocg agogcgacgc ccggaagcat tgacgfcgceg caggfcgafcgg 15300 

catcgacatt cagcgaccag gtgccgggca gtgagggcgg cggcctgggt ggcggcctgc 15360 

ccttcacfctc ggccgtcggg gcattcacgg acttcatggc ggggccggca atttttacct 15420 

tgggcattct tggcatagtg gtcgcgggtg ccgtgctcgt gttcgggggt gcgataaacc 15480 

cagcgaacca tttgaggtga taggtaagat fcataccgagg tatgaaaacg agaattggac 15540 

ctttacagaa ttactctatg aagcgccata tttaaaaagc taccaagacg aagaggatga 15600 
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agaggatgag gaggcagatt gccttgaata tattgacaat actgataaga taatatatct 15660 

tttatataga agatatcgcn gtahgf-.aagg atttcaergaer gcaaggcafca ggcagcgcgc 15720 

ttatcaatat atctatagaa tgggcaaagc ataaaaactt gcatggacta atgcttgaaa 15780 

cccaggacaa taaccttata gcttgtaaat tctatcataa ttgggtaatg actccaactfc 15840 

attgatagtg ttttatgttc agataatgcc cgatgacttt gtcatgcagc tccaccgafct 15900 

ttgagaacga cagcgacttc cgtcccagcc gtgccaggtg ctgcctcaga ttcaggttat 15960 

gccgctcaat tcgctgcgta tatcgcttgc tgattacgtg cagctttccc ttcaggcggg 16020 

attcatacag cggccagcca tccgtcatcc atatcaccac gtcaaagggt gacagcaggc 16080 

Lcataagacg ccccagogtc gccatagtgc gtteaccgaa taogt-crcgna anaaccgtct 16140 

tccggagact gtcatacgcg taaaacagcc agcgctggcg cgatttagcc ccgacatagc 16200 

cccactgfctc gtccatttco gcgcagacga tgacgtcact gcccggctgt atgcgcgagg 16260 

ttaccgactg cggcctgagt tttttaagtg acgtaaaatc gtgttgaggc caacgcccat 16320 

aatgcgggct gttgcccggc atccaacgcc attcatggcc atatcaatga tfcttctggtg 163 80 

cgtaccgggt tgagaagcgg tgtaagtgaa ctgcagttgc catgttttac ggcagtgaga 16440 

gcagagatag cgctgatgtc cggcggtgct tttgccgtta cgcaccaccc cgtcagtagc 16500 

tgaacaggag ggacagctga tctgacacacja. agccactgga gco.cct.aaaa aaoacoatoa 165S0 

tacactaaat cagtaagttg gcagcatcac ccataattgt ggtttcaaaa tcggctccgfc 16620 

cgatactatg ttatacgcca actttgaaaa caactttgaa aaagctgttt tctggtattt 16680 

aaggttttag aatgcaagga acagtgaatt ggagttcgfcc ttgttataat tagcttcttg 16740 

gggtatcttt aaatactgta gaaaagagga aggaaataat aaatggctaa aatgagaata 16800 
tcaccggaat tgaaaaaact gatcgaaaaa taccgctgcg taaaagatac ggaaggaatg 16860 
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tctcctgcta aggtatataa gctggtggga gaaaatgaaa acctatattt aaaaatgacg 16920 
aacagccast ataaacraaac cacctafcgat gtggaacggg aaaaggacat gatgctatgg 16980 
ctggaaggaa agctgcctgt tccaaaggtc ctgcacttfcg aacggcatga tggctggagc 17040 
aatctgctca tgagtgaggc cgatggcgfcc ctttgctcgg aagagtatga agatgaacaa 17100 
agccctgaaa agattatcga gctgtatgcg gagtgcatca ggctcbttca ctccatcgac 17160 
atatcggatt gtccctatac gaatagctta gacagccgct tagccgaatt ggattactta 17220 
ctgaataacg atctggccga tgtggattgc gaaaactggg aagaagacac tccatttaaa 17280 
gatccgcgcg agctgtatga ttttttaaag acggaaaagc ccgaagagga acttgtcttt 17340 
tocoaogcjcg aeofegggaga csgcaacatc tttatgaaag atggcaaagt aagtggcttt 17400 
attgatcttg ggagaagcgg cagggcggac aagtggtatg acattgcctt ctgcgtccgg 17460 
tcgatcaggg aggatatcgg ggaagaacag tatgtcgagc tattttttga cttactgggg 17520 
atcaagcctg attgggagaa aataaaatat tatattttac tggatgaatt gttttagtac 17580 
ctagatgtgg cgcaacgatg ccggcgacaa gcaggagcgc accgacttct tccgcatcaa 17640 
gtgttttggc tctcaggccg aggcccacgg caagtatttg ggcaaggggt cgctgghatt 17700 
cgfcgcagggc aagattcgga ataccaagta cgagaaggac ggccagacgg tctacgggac 17760 
uyacttcatt gccgataagg tggattsfccte ggacscnaag gcaccagefCCf ggtcaaatca 1782 0 
ggaataaggg cacattgccc cggcgtgagt cggggcaatc ccgcaaggag ggtgaatgaa 17880 
tcggacgttt gaccggaagg catacaggca agaactgatc gacgcggggt tttccgccga 17940 
ggatgccgaa accatcgcaa gccgcaccgt catgcgtgcg ccccgcgaaa ccttccagtc 18000 
cgtcggctcg atggtccagc aagctacggc caagatcgag cgcgacagcg tgcaactggc 18060 
tccccctgcc ctgcccgcgc catcggccgc cgtggagcgt tcgcgtcgfcc tcgaacagga 18120 
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ggcggcaggt ttggcgaagt cgatgaccat cgacacgcga ggaactatga cgaccaagaa 18180 
gcgaaaaacc gwggogagg acctggcaaa acaggtcagc gaggeeaagc aggnngcicftt 
. gctgaaacac acgaagcagc agatcaagga aatgcagctt tccttgttcg atattgcgcc 
gtggccggac acgatgcgag cgatgccaaa cgacacggcc cgctctgccc tgttcaccac 
gcgcaacaag aaaatcccgc gcgaggcgct gcaaaacaag gtcattttcc acgtcaacaa 18420 
ggacgtgaag atcacctaca ccggcgtcga gctgcgggcc gacgatgacg aactggtgtg 18480 
gcagcaggtg ttggagtacg cgaagcgcac ccctatcggc gagccgatca ccttcacgtt 18540 
cfcacgagctt tgccaggacc tgggctggtc gatcaatggc cggtattaca cgaaggccga 
ggaatgcctg tcgcgcctac aggcgacggc gatyygcttc acgtccgacc gcgfctgggaa 
cctggaafccg gtgtcgctgc tgcaccgctt ccgcgtcctg gaccgtggca agaaaacgtc 
ccgttgccag gtcctgatcg acgaggaaat cgtcgtgctg tttgctggcg accactacac 18780 
gaaattcata tgggagaagt accgcaagct gtcgccgacg gcccgacgga tgttcgacta 18840 
tttcagctcg caccgggagc cgtacccgct caagctggaa accttccgcc tcatgtgcgg 18900 
afccggattcc acccgcgtga agaagtggcg cgagcaggtc ggcgaagcct gcgaagagtt 18960 
gcgaggcagc ggcctggtgg aacacgcctg ggtcaatgat gacctggtgc attgcaaacg 19020 
ctagggcctt gtggggtcag ttccggctgg gggttcagca gccagcgctt taoLggcatt 19000 



18240 
18300 
18360 



18600 
18660 
18720 



19140 
19200 



tcaggaacaa gcgggcactg ctcgacgcac ttgcttcgct cagtatcgct cgggacgcac 
ggcgcgctct acgaactgcc gataaacaga ggattaaaat tgacaattgt gattaaggct 
cagattcgac ggcttggagc ggccgacgtg caggafcttcc gcgagatccg attgtcggcc 19260 
ctgaagaaag otccagagat gttcgggfccc grttfeacgagc acgaggagaa aaagcccata 



19320 



WO 2004/063358 PC17EP2004/000100 
245/358 

gaggcgttcg ctgaacggtt gcgagatgcc gtggcattcg gcgcctacat cgacggcgag 19380 
atcattgggc tgtcggtcfct caaacaggag gacggcccca aggacgctca caaggcgcat 19440 
ctgtccggcg ttttcgtgga gcccgaacag cgaggccgag gggfccgccgg tatgctgctg 19500 
cgggcgttgc cggcgggttt attgctcgtg atgatcgtcc gacagattcc aacgggaatc 19560 
tggtggatgc gcatcttcat cctcyycgett uLta.ato.fctt. cgctafctctg gagattgfctg 19620 
tttatttcgg tctaccgcct gccgggcggg gtcgcggcga cggtaggcgc tgtgcagccg 19680 
ctgatggtcg tgttcatctc tgccgctctg ctaggtagcc cgahacgatfc gatggcggtc 19740 
ctgggggcta tttgcggaac tgcgggcgtg gcgctgttgg tgttgacacc aaacgcagcg 19800 
ctagatcctg tcggcgtcgc agcgggcctg gcgggggcgg tttccatggc gttcggaacc 19860 
gtgctgaccc gcaagtggca acctcccgtg cctctgctca cctttaccgc ctggcaactg 19920 
gcggccggag gacttctgct cgttccagta gctttagtgt ttgatccgcc aatcccgatg 19980 
cctacaggaa ccaatgttct cggcctggcg tggctcggcc tgatcggagc ggyUUUa=tc;c 3 0040 
tacttccttt ggttccgggg gatctcgcga ctcgaaccta cagttgtttc cttactgggc 20100 
tttctcagcc ccagatctgg ggtcgatcag ccggggatgc atcaggccga cagtcggaac 20160 
ttcgggtccc cgacctgtac cattcggtga gcaatggata ggggagttga tatcgtcaac 20220 
gttcacttct aaagaaatag cgccactcag cttcctcagc ggctttatcc agcgatttcc 20280 
tattatgtcg gcatagttct caagatcgac agccfcgtcac ggttaagcga gaaatgaata 2034O 
agaaggctga taattcggat ctctgcgagg gagatgatat ttgatcacag gcagcaacgc 20 400 
tctgtcatcg ttacaafccaa catgctaccc tccgcgagat catccgtgtt tcaaacccgg 20460 
cagcttagtt gccgttcttc cgaatagcat cggtaacatg agcaaagtct gccgccttac 20520 
aacggctctc ccgctgacgc cgtcccggac tgatgggctg cctgtatcga gtggtgattt 20580 
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tgtgccgagc tgccggtcgg ggagctgttg gctggctggt ggcaggatat attgtggtgt 20640 
aaacaaattg acgcttagac aacttaataa cacattgcgg acgtttttaa tgtactgggg 20700 
tggtttttct tttcaccagt gagacgggca acagctgatt gcccttcacc gcctggccct 20760 
gagagagttg cagcaagcgg tccacgctgg tttgccccag caggcgaaaa tcctgtttga 20820 
tggtggttcc gaaatcggca aaatccctta taaatcaaaa gaatagcccg agatagggtt 20.860 
gagtgttgtt ccagtttgga acaagagtcc actattaaag aacgtggact ccaacgtcaa 20940 
»gggeaa»aa accgtctatc agggcgatgg cccactacgt gaaccatcac ccaaatcaag 21000 
ttttttgggg tcgaggtgcc gtaaagcact aaatcggaac cctaaaggga gcccccgatt 21060 
tagagcttga cggggaaagc cggcgaacgt ggcgagaaag gaagggaaga aagcgaaagg 21120 
agcgggcgcc attcaggctg cgcaactgtt gggaagggcg atcggtgegg gcctcttcgc 21180 
tattacgcca gctggcgaaa gggggatgtg ctgcaaggcg attaagttgg gtaacgccag 21240 
ggttttccca gtcacgacgt tgtaaaacga cggccagtga attogagctc ggtaccoggg 21300 
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<400> 47 

ccgggctggt tgccctcgcc gctgggctgg cggccgtcta tggccctgca aacgcgccag 60 

aaacgccgtc gaagccgtgt gcgagacacc gcggccgccg gcgttgtgga tacctcgcgg 120 

aaaacttggc cctcactgac agatgagggg cggacgttga cacttgaggg gccgactcac 180 

ccggcgcggc gttgacagat gaggggcagg ctcgatttcg gccggcgacg tggagctggc 240 

cagcctcgca aatcggcgaa aaegcctgat tttacgcgag tttcccacag atgatgtgga 300 

caagcotggg gataagtgcc ctgcggtatt gacacttgag gggcgcgact actgacagat 360 

gaggggcgcg atccttgaca cttgaggggc agagtgctga cagatgaggg gcgcacctat 420 

tgacafcttga ggggctgtcc acaggcagaa aatccagcat ttgcaagggt fctccgcccgt 480 

ttfcterjgr^a negctaacct gtcttttaac ctgcttttaa accaatattt ataaaccttg 540 

tttttaacca gggctgcgcc ctgtgcgcgt gaccgcgcac gccgaagggg ggtgcccccc 600 

Cttctcgaac cctcccggcc cgctaacgug ggcctcccat ccccccaggg gatgagcccc 660 

tcggccgcga acggcctcac cccaaaaatg gcagcgotgg cagtccttgc cattgccggg 720 

atcggggcag taacgggatg ggcgatcagc ccgagcgcga cgcccggaag cattgacgtg 780 

ccgcaggtgc tggcatcgac attcagcgac caggtgccgg gcagtgaggg cggcggcctg 840 

ggtggcggcc tgcocttcac ttcggccgtc ggggcattca cggacfctcat ggcggggccg 900 

gcaattttta ccttgggcat tcttggcata gtggtcgcgg gtgccgtgct cgtgttcggg 960 
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1080 



ggtgcgataa acccagcgaa ccatttgagg tgataggtaa gattataccg aggtatgaaa 
acgagaattg gacctttaca gwbtactct atgaagogoc atattfca&aa agct.ar.caaa 
acgaagagga tgaagaggat gaggaggcag attgccttga atatattgac aatactgata 1140 
agataatata tcttttatat agaagatatc gccgtatgta aggatttcag ggggcaaggc 1200 
ataggcagcg cgcttatcaa tatatctata gaatgggcaa agcataaaaa cttgcatgga 1260 
ctaatgcttg aaacccagga caataacctt atagcttgta aattctatca taattgggta 1320 
atgactccaa cttattgata gfcgttttatg ttcagataat gcccgatgac tttgtcatgc 1380 
agctccaccg attttgagaa cgacagcgac ttccgtccca gccgtgccag gtgctgcctc 1440 
agattcaggt tatgccgctc aattcgctgc gtatatuyut tgctgatfcac gtgcagattfc 1500 
cccttcaggc gggattcata cagcggccag ccatccgtca tccatatcac cacgtcaaag 
ggtgaaagca ggctcataag acgccccagc gtcgccatag tgcgttcacc gaatacgtgc 
gcaacaaccg tcttccggag actgtcatac gcgtaaaaca gccagogctg gcgcgattta 
gccccgacat agccccactg ttcgtccafct tccgcgcaga cgatgacgtc actgcccggc 
tgtatgcgcg aggttaccga ctgcggcctg agttttttaa gtgacgtaaa atcgfcgttga 
ggccaacgcc cataatgcgg gctgttgccc ggcatccaac gccattcatg gccatatcaa 1860 
tgattttctg gtgcgtaccg ggttgagaag cggtgtaagt gaactgcagt tg«w*tgfctt 1920 
bacggcagtg agagcagaga tagcgctgat gtccggcggt gcttttgccg ttacgcacca 1980 
ccccgtcagt agctgaacag gagggacagc tgatagacac agaagccact ggagcacctc 2040 
aaaaacacca tcatacacta aatcagtaag ttggcagcat caccaataat tgtggtttca 2100 
aaatcggctc cgtcgatact atgttatacg ccaactttga aaacaacttt gaaaaagctg 2160 
ttttctggta tttaaggttt fcagaatgcaa ggaacagtga attggagttc gtcttgttat 



1560 
1620 
1680 
1740 
1800 
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aattagcttc ttggggtafcc tttaaatact gtagaaaaga ggaaggaaat aataaatggc 2280 

taaaatgasa atafccaccgg aattgaaaaa actgatcgaa aaataccgct gcgtaaaaga 2340 

tacggaagga atgtctcctg ctaaggtata taagctggtg ggagaaaatg aaaacctata 2400 

tttaaaaatg acggacagcc ggtataaagg gaccacctat gatgtggaac gggaaaagga 2460 

catgatgcta tggctggaag gaaagctgcc tgttccaaag gtcctgcact ttgaacggca 2520 

tgatggctgg agcaatctgc tcatgagtga ggccgatggc gtcctttgct cggaagagta 2580 

tgaagatgaa caaagccctg aaaagattat cgagctgtat gcggagtgca tcaggctctt 2640 

tcactccatc gacatatcgg attgtcccta tacgaatagc ttagacagcc gcttagccga 2700 

attggattae ttactgaata angahcfccrgc caatgtggat tcrcaaaaact gggaagaaga 2760 

cactccattt aaagatccgc gcgagctgta tgatttttfca aagacggaaa agcccgaaga 2820 

ggaacttgtc ttttcccacg gcgacctggg agacagcaac atctttgtga aagatggcaa 2880 

agtaagtggc tttattgatc ttgggagaag cggcagggcg gacaagtggt atgacattgc 2940 

cttctgcgtc cggtcgatca gggaggatat cggggaagaa cagtatgtcg agctattttt 3000 

tgacttactg gggatcaagc ctgattggga gaaaataaaa tattatattt tactggatga 3 060 

attgttttag tacctagatg tggcgcaacg atgccggcga caagcaggag cgcaccgact 3120 

tcfctccgcah caagfcgttfct ggototaagg ecgaggeoca oggcaagtat- fct-.gggcaagg 3180 

ggtcgctggt attcgtgcag ggcaagattc ggaataccaa gtacgagaag gacggccaga 3240 

cggtctacgg gaccgacttc attgccgata aggtggatta tctggacacc aaggcaccag 3300 

gcgggtcaaa tcaggaataa gggcacattg ccccggcgtg agtcggggca atcccgcaag 3360 

gagggtgaat gaatcggacg fcttgaccgga aggcafcacag gcaagaacfcg atcgacgcgg 3420 

ggttttccgc cgaggatgcc gaaaccatcg caagccgcac cgtcatgcgt gcgccccgcg 3480 
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aaaccttcca ghccgtcggc tcgatggtcc agcaagctac ggccaagatc gagcgcgaca 3540 

gcgtgcaetct ggctccccct gcoctgcccg dgooatcggc cgcegtggrag cgttcgcgtc 3600 

gtctcgaaca ggaggcggca ggtttggcga agtcgatgac catcgacacg cgaggaacta 3660 

tgacgaccaa gaagcgaaaa acngccggcg aggacctggc aaaacaggtc agcgaggcca 372 0 

agcaggccgc gttgctgaaa cacacgaagc agcagatcaa ggaaatgcag ctttccttgt 3780 

tcgatattgc gccgtggccg gacacgatgc gagcgatgcc aaacgacacg gcccgctctg 3840 

ccctgttcae cacgcgcaac aagaaaatcc cgcgcgaggc gctgcaaaac aaggtcattt 3900 

tccacgtcaa caaggacgtg aagatcacct acaccggcgt cgagctgcgg gccgacgatg 3960 

acgaactggt gtggcagcag gtgttggagt acgcgaagcg cacccotato ggcgagaoga 4020 

tcaccttcac gttctacgag ctttgccagg acctgggctg gtcgatcaat ggccggtatt 4080 

acacgaaggc cgaggaatgc ctgtcgcgcc tacaggcgac ggcgatgggc ttcacgtccg 4140 

accgcgttgg gcacctggaa tcggtgtogc tgctgcaccg cttccgcgtc ctggaccgtg 4200 

gcaagaaaac gtcccgttgc caggtcctga tcgacgagga aatcgtcgtg ctgtttgctg 4260 

gcgaccacta cacgaaattc atatgggaga agtaccgcaa gctgtcgccg acggcccgac 4320 

ggatgttcga ctatttcagc tcgcaccggg agccgtaccc gctcaagctg gaaaccttcc 4380 

gcctcatgtg cggatcggat tccacccgcg tgaagaagtg gcgcgagcag gtcggcgaag 4440 

cctgcgaaga gttgcgaggc agcggcctgg tggaacacgc ctgggtcaat gatgacctgg 4500 

tgcattgcaa acgctagggc cttgtggggt cagttccggc tgggggttca gcagccagcg 4560 

ctttacfcggc atttcaggaa caagcgggca ctgctcgacg cacttgcttc gctcagtatc 4620 

gctcgggaug cacggcgcgc tctacgaaot googataaac agaggafcfcaa aattgacaat 4680 
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tgtgattaag gctcagattc gac ggc ttgg agcggccgac gtgcaggatfc tccgcgagat 4740 
ccgattgtcg gccctgaaga aagctccaga gatgttcggg tccgtttacg agcacgagga 4800 
gaaaaagccc atggaggcgt tcgctgaacg gttgcgagat gccgtggcat tcggcgccta 4860 
catcgacggc gagatcattg ggctgtcggt cttcaaacag gaggacggcc ccaaggacgc 4920 
tcacaaggcg catctgtccg gcgttttcgt ggagcccgaa cagcgaggcc gagyggtcgo 4980 
cggtatgctg ctgcgggcgt tgccggcggg tttattgctc gtgatgatcg tccgacagat 5040 
tew atctggtaaa tgcgcatctt catccfccggc gcacttaata tttcgctatt 5100 
ctggagcttg ttgtttattt cggtctaccg cctgccgggc ggggtcgcgg cgacggtagg 5160 
cgctgtgcag ccgctgatgg tcgtgttcat ctctgccgct ctgctaggta gcccgatacg 5220 
attgatggcg gtcctggggg ctatttgcgg aactgcgggc gtggcgctgt tggtgttgac 5280 
accaaacgca gcgctagatc ctgtcggcgt cgcagcgggc ctggcggggg cggtttccat 5340 
ggcgttcgga accgtgctga cccgcaagtg gcaacctccc gtgcctctgc tcacctttac 5400 
cgcctggcaa ctggcggccg gaggacttct gctcgtfccca gtagctttag tgtttgatcc 5460 
gccaatcoog atgeotanag gaaccaatgt tctcggcctg gcgtggctcg gcctgatcgg 5520 
agcgggttta acctacttcc tttggttccg ggggatctcg cgactcgaac ctacagttgt 5580 
ttccttactg ggctttctca gccccagatc tggggtcgat cagccgggga tgcatcaggc 5640 
cgacagtcgg aacttcgggt ccccgacctg taccattcgg tgagcaatgg ataggggagt 5700 
tgatatcgtc aacgttcact tctaaagaaa tagcgccact cagcttcctc agcggcttta 5760 
tccagcgatt tcctattatg tcggcatagt tcfccaagatc gacagcctgt cacggttaag 5820 
cgagaaatga ataagaaggc tgataattcg gatctctgcg agggagatga tatttgatca 5880 
caggcagcaa cgctctgtca tcgfctac^t r^fcoota ccctccgcga gatcatccgt 5940 
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gtttcaaacc cggcagctta gttgccgttc ttccgaatag catcggtaac atgagcaaag 6000 
tctgccgcct tacaacggct ctcccgctga cgccgtcccg gactgatggg ctgcctgtat 6060 
cgagtggtga tfcttgtgccg agctgccggt cggggagctg ttggctggct ggtggcagga 6120 ^ 
tatattgtgg tgtaaacaaa ttgacgctta gacaacttaa taacacatfcg cggacgfcttt 6180 
taatgtactg gggtggtttt tcttttcacc agtgagacgg gcaacagctg attgccctt. G240 
accgcctggc cctgagagag ttgcagcaag cggtccacgc tggtttgccc cagcaggcga 6300 
a a at co tgtt tg a t^.Bat tccaaaatcg gcaaaatccc htataaatca aaagaafcagc 6360 
ccgagatagg gttgagtgtt gttccagttt ggaacaagag tccactatta aagaacgtgg 6420 
actccaacgt caaagggcga aaaaccgtct atcagggcga tggcccacta cgtgaaccat 6480 
cacccaaatc aagttttttg gggtcgaggt gccgtaaagc actaaatcgg aaccctaaag 6540 
ggagoccccg atttagagct tgacggggaa agccggcgaa cgtggcgaga aaggaaggga 6600 
agaaagcgaa aggagcgggc gccattcagg ctgcgcaact gttgggaagg gcgatcggtg 6660 
cgggcctctt cgctattacg ccagctggcg aaagggggat gtgctgcaag gcgattaagt 6720 
tgggt^cgc oagggttttc ooagto^ga cgttgtaaaa cgacggccag tgaattcgag 6780 
ctcggtaccc ggggatcttt cgacactgaa atacgtcgag cctgctccgc ttggaagcgg 6840 
cgaggagcct cgtcctgtca caactaccaa catggagtac gataagggcc agttccgcca 6900 
gctcattaag agccagttca tgggcgttgg catgatggcc gtcatgcatc tgfcacttcaa 6960 
gtacaccaac gctcttctga tccagtcgat catccgctga aggcgctttc gaatctggtt 7020 
aagatccacg tcttcgggaa gccagcgact ggtgacctcc agcgtccctt taaggctgcc 7080 
aacagctttc tcagccaggg ccagcccaag accgacaagg cctccctoca gaacgccgag 7140 
aagaactgga ggggt^gt caaggaggag taagetent-.t attgaactcg gaggacggag 7200 
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cggtgtcaag aggatattct tcgactctgt attatagata agatgatgag gaafctggagg 7260 

tagcatagct tcatttggat ttgctttcca ggctgagact ctagcttgga gcatagaggg 7320 

tcctttggct ttcaatattc tcaagtatct cgagtttgaa cttattccot gtgaaccttt 7380 

fcattcaccaa tgagcattgg aatgaacatg aatctgagga ctgcaatcgc catgaggttt 7440 

tcgaaataca tccggatgtc gaaggcttgg ggcacctgcg tL«<jtt gaa t fct agQ acgtg 7500 

gcactattga tcatccgata gctctgcaaa gggcgttgca caatgcaagt caaacgttgc 7560 

taacagttcc aggtggaatg ttatgatgag cattgtatta aatcaggaga tatagcatga 7620 

tctctagtta gctcaccaca aaagtcagac ggcgtaacca aaagtcacac aacacaagct 7680 

gtaaggattt cggcacggct acggaagacg gagaagccac cttcagtgga ctcgagtacc 7740 

atttaattct atttgtgttt gatcgagacc taatacagcc cctacaacga ccatcaaagt 7800 

cgtatagcta ccagtgagga agtggactca aatcgacttc agcaacatct cctggataaa 7860 

ctttaagcct aaactataca gaataagata ggtggagagc ttataccgag ctcccaaate 79-20 

tgtccagatc atggttgacc ggtgcctgga tcttcctata gaatcatcct tattcgttga 7980 

cetegnfcgat tctggagtga cccagagggt catgacttga gcctaaaatc cgccgcctcc' 8040 

accatttgta gaaaaatgtg acgaactcgt gagctctgta cagtgaccgg tgactctttc 8100 

tggcatgcgg agagacggac ggacgcagag agaagggctg agtaataagc cactggccag 8160 

acagctctgg cggctctgag gtgcagtgga tgattattaa tccgggaccg gccgcccctc 82 20 



8280 



cgccccgaag tggaaaggct ggtgtgcccc tcgttgacca agaatctatt gcatcatcgg 

agaatatgga gcttcatcga atcaccggca gtaagcgaag gagaatgtga agccaggggt 8340 

gtatagccgt cggcgaaata gcafcgccatt aacctaggta cagaagtcca attgcttccg 8400 

atctggtaaa agattcacga gatagtacct tctccgaagt aggtagagcg agtacccggc 8460 
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gcgtaagctc cctaattggc ccatccggca tctgtagggc gtccaaatat cgtgcctctc 8520 

ctgcLLUgcc cggtgfcatga aaccggaaag gcegeteacra agctaaccaff cggcgcagac 8580 

cgggaacaca agctggcagt cgacccatcc ggtgctctgc actcgacctg ctgaggtccc 8640 

tcagtccctg gtaggcagct ttgccccgtc tgtccgcccg gtgtgtcggc ggggttgaca 8700 

aggtcgttgc gtcagtccaa catttgttgc catattttcc tgctctcccc accagctgct 8760 

cttttctttt ctctttcttt tcccatcttc agtatattca tcttcccatc caagaacctt 8820 

tabttcccct aagtaagtac tttgctacat ccatactcca tccttcccat cccttattcc 8880 

tttgaacett tcagttcgag ctttcccact tcatcgcagc tfcgactaaca gctaccccgc 8940 

ttgagcagac atcaccatgc cty^tcac cgcgacgtot gfccgagaagt htctgafcctja 9000 
aaagttcgac agcgtctccg acctgatgca gctctcggag ggcgaagaat ctcgtgcttt 9060 
cagcttcgat gtaggagggc gtggatatgt cctgcgggta aatagctgcg ocgatggttt 9120 
ctacaaagat cgttatgttt atcggcactt tgcatcggcc gcgctcccga ttccggaagt 9180 
gcttgacatt ggggaattca gcgagagcct gacctattgc atctcccgcc gtgcacaggg 9240 
tgtcacgttg caagacctgc ctgaaaccga actgcccgct gttctgcagc cggtcgcgga 9300 
ggccatggat gcgatcgctg cggccgatct tagccagacg agcgggttcg gcccattcgg 9360 
accgcaagga atcggtcaat acactacatg gcgtyaLtfcc a t*tgcgcga ttgctgatcc 9420 
ccatgtgtat cactggcaaa ctgtgatgga cgacaccgtc agtgcgtccg tcgcgcaggc 9480 
tctcgatgag ctgatgcttt gggccgagga ctgccccgaa gtccggcacc tcgtgcacgc 9540 
ggatttcggc tccaaoaatg tcctgacgga caatggccgc ataacagcgg tcattgactg 9600 
gagcgaggcg atgttcgggg attcccaata cgaggtcgco aacatcttct tctggaggcc 9660 
gtggttggct tgtatggagc agcagacgcg ctacttcgag cggaggcatc cggagcttgc 9720 
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aggatcgccg cggctccggg cgtatatgct ccgcattggt cttgaccaac tctatcagag 9780 
cttggttg ac ggcaatttcc atgatgcagc ttgggcgcag ggtcgatgcg acgcaatcgt 9840 
ccgatccgga gccgggactg tcgggcgtac acaaatcgcc cgcagaagcg cggccgtctg 9900 
gaccgatggc tgtgtagaag tactcgccga tagtggaaac cgacgcccca gcactcgtcc 9960 
gagggcaaag gaatagagta gatgccgacc gcgggatcga tccacttaac gttactgaaa ' 10020 
tcatcaaaca gottgacgaa tctggatata ' agatcgttgg tgtcgatgtc agctccggag 10080 
ttgagacaaa tggtgttcag gatctcgata agatacgttc atttgtccaa gcagcaaaga 10140 
gtgccttcta gtgatttaat agctccatgt caacaagaat aaaacgcgtt ttcgggttta 10200 
octette atacasctoa t ct g ^t S c attaatgcat tgactgcaac ctagtaacgc 10260 
cttncaggct ccggcgaaga gaagaatagc ttagcagagc fcattttcatt ttcgggagac 10320 
g agatcaagc agatcaacgg tcgtcaagag acctacgaga ctgaggaatc cgctcttggc 10380 
tccacgcgac tatatatttg tctctaattg tactttgaca tgctcctctt otttactctg 10440 
atagcttgac tatgaaaatt ccgtcaccag cncctgggtt cgcaaagata attgcatgtt 10500 
tcttccttga actctcaagc ctacaggaca cacattcatc gtaggtataa acctcgaaat lObOO 
canttcctao taagatggta tacaatagta accatgcatg gttgcctagt gaatgctccg 10620 
taacacccaa ta Cg c Cg goc ^tt ttt «tc ctatgagtcg tttacccaga 10680 
atgcacaggt acacttgttt agaggtaatc cttctttcta gctagaagtc ctcgtgtact 10740 
gtgtaagcgc ccactccaca tctccactcg acctgcaggc atgoaagctt cattttgctt 10800 
tgtaaatttc tggtaactgc caccaagaaa tatgaggata ttcgtgatgt tcctcgtggt 10860 
agccaaaatg atagcacgtg ataaatgacc accaaatagg acggctaatt gtttgggcac 10920 
aatgaggctg aacataaccc cctattggtt cactatgggg taaaaaagta ccaaaataga 10980 
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ataattgtaa tgaacttaaa agcgagggta gcacccaaaa gtaagttaga ttatcacttg 11040 
ggatatggag ftgt*^ g««a»*«* ^ataatagt caacgcaatt atttgccccc 11100 
aactocagta acctttcata aaatgaaaat accaagcaaa gaaactfctgg tgtttaccat 11160 
tgtgaaaatc cgggtctatt gagcttgctg gattgtggtg gtgtaaccaa tgttttttca 11220 
atagtttttg atatggtaaa agaccataaa gggatagggt caatgttcca atcaaatgat 11280 
taatcttggt gttttgggga aatactacgc catgcatggc atcatgagat gtaataaata 11340 
atcccgtata taaaaatgtt tgccatagta taacaggcaa taacatcoaa aattttagct 11400 
ttgagatgtc aagggaaagt aataaactca ggctaatgao ccatgcgcta acaatgacaa 11460 
tagcaatgaa aagcccctta - t t cto a g M agttttgctt 11520 

gatgactgag tggttgttct aactggatca tttctaaaga gaaggtggaa caatgttage 11580 
ataattgtgc ttgagtgagg actttgaggg taggtacata cttgataaag ttaatgatta 11640 
aagagaaaaa aaaagttttg gttcaaagca gaaattgtfct tttaaatcga ttggtgagaa 11700 
aatttttttc tgtttccgca tcaccaaagc oacctcagga atggtcacaa attattggtc 11760 
tgattggacc ataagcatac aaaaagttca ttgaagtata cttagtggct tattagactt 11820 
ttatogtttt ctaacgcgaa tcagcaatgt ttcttgtttg atttactgct tgctttagat 11880 
catttttgtc tgaaatatta tgc-tW* c^cc t-t.tttcatg HMO 

cttaaacacg ttgtttattc catatattac tttgaatatg catcaccgca aagcggaagt 12000 
acaaaataac aaagaacctc tttgggttac acgatcaact gctattgtga aaaaaatttc 12060 

tttttgaaaa tttttggaat aatatctctt gcaaaaaaga aatt.ttgtat atttagtagc 12120 
atcaagaac* a^agaa acaacraatac atcatcttta gacaaaagta 12180 
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cgagaaaaat ctaataagtt gttatagagg tctttgtttt ctttgtgttt afcagacagtt 12240 
atttagagtt tgaaaagtgt ctctaatgtg tcttttttta ttattattat ttcaaatgtt 12300 
atgtaatata gctaaagcta tagatttgac attttttcta aatataaaat tteagtcaac 12360 
agaaataaat gacacgagtt ctttttctct ctctcaatcc tgttgatcat caatctttga 12420 
tgtcgtttta aaacaaatga atggcattta gttcuttagg tgtcacfcoac atcttgtfcg* 12480 
ccagaaaatc cttattcgcc ctcaaatctg ctttattcct ttcatttgat ttgatgttta 12540 
agtaatgcaa gcaaacaaaa aagaaacctt tcttgcaaag acaaaagaat tgttttcaga 12600 
ggaaagcaac tcgttgtcat tttttaagga tfctagactta taatcgacac catagtttgt 12660 
ccgttacatt ttttahtgtc gttttctgat ttccttttaa tctttaagca aaatcaatat 12720 
taacttatct tgtcttccaa taaaaaatgg ataccaataa caataaatcc ttcacaaaga 12780 
aaaaaaaaaa aaactcgaaa aaagcttggc gtaatcatgg tcatagctgt ttcctgtgtg 12840 
aaattgttat ccgctcacaa ttccacacaa catacgagcc ggaag C *Laa « 9 tgt«ago 12900 
ctggggtgcc taatgagtga gctaactcac attaattgcg ttgcgctcac tgcccgcttt 12960 
««ahoo«l» aacctgtcgt gccagctgca ttaatgaatc ggccaacgcg cggggagagg 13020 
cggttfcgcgt at tgggccaa agacaaaagg gcgacattca accgattgag ggagggaagg 13080 
taaatattga cggaaattat tcattaaagg tgaattatca ccgtcaccga cttgagccat 13140 
ttgggaatta gagccagcaa aatcaccagt agcaccatta ccattagcaa ggccggaaac 13200 
gtcaccaatg aaaccatcga tagcagcacc gtaatcagta gcgacagaat caagtttgcc 13260 
tttagcgtca gactgtagcg cgttttcatc ggcattttcg gtcatagccc ccttattagc 13320 
gtttgccatc ttttcataat caaaatcacc ggaaccagag ccaccaccgg aaccgcctcc 13380 
eboeroooff coacactcag aaccgccacc ctcagagcca ccaccctcag agccgccacc 13440 
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agaaccacca ccagagccgc cgccagcatt gacaggaggc ccgatctagt aacatagatg 13500 
acaccgcgcg cgataattta tcctagtttg cgcgctatat tttgttttct atcgcgtatt 13560 
aaatgtataa ttgcgggact ctaatcataa aaacccatct- cataaataac gtcatgcatt 13620 
acatgttaat tattacafcgc ttaangtaat tcaacagaaa ttatatgata atcatcgcaa 13680 
gaccggcaac aggattcaat cttaagaaac tttattgcca aatgtttg** cgatcgggga 13740 
tcatccgggt ctgtggcggg aactccacga aaatatccga acgcagcaag atatcgcggt 13800 
gcatetcggt cttgcctggg cagtcgocgc cgacgccgtt gafcgtggacg ccgggcccga 13860 
teatattgtc gctcaggatc gtggcgttgt gcbtgtcggc cgttgctgtc gtaatgatat 13920 
cggcaccttc gaccgcctgt tccgcagaga tcccgtgggc gaagaactco agcatgagat 13980 
ccccgcgctg gaggatcatc cagccggcgt cccggaaaac gattccgaag cccaaccttt 14040 
catagaaggc ggcggtggaa tcgaaatctc gtgatggcag gttgggcgtc gcttggtcgg 14100 
tcatttcgaa ccccagagtc ccgctcagaa gaactcgtca agaaggcgat agaaggcg*u 14160 
gcgctgcgaa tcgggagcgg cgataccgta aagcacgagg aagcggtcag cccattcgcc 14220 
gocaagotc t to.gcaatat cacgggtagc caacgctatg tcctgatagc ggtccgccac 14280 
acccagccgg ccacagtcga tgaatccaga aaagcggcca ttttccacca tgatattcgg 14340 
caagcaggca tcgecatggg tcacgacgag atcatcgccg tcgggcatgc gcgccttgag 14400 
cctggcgaac agttcggctg gcgcgagocc ctgatgctct tcgtccagat catcctgatc 14460 
gacaagaccg gcttccatcc gagtaogtgc tcgctcgatg cgatgtttcg cttggtggtc 14520 
gaatgggcag gtagccggat caagcgtatg cagccgccgc attgcatcag ccatgatgga 14580 
tactttctcg gcaggagcaa ggtgagatga caggagatcc tgccccggca cttcgcccaa 14640 
ba H c a gc C ag tcccttcccg ctteagtgac aacgtcgagc acagctgcgc aaggaacgcc 14700 



14820 
14880 



15120 
15180 



WO 2004/063358 PCT/EP2004/000100 
259/3S8 

cgtcgtggcc agccacgata gccgcgctgc ctcgtcctgc agfctcattca gggcacogga 14760 
caggtcggtc ttgacaaaaa gaaccgggcg cccctgcgct gacagccgga acacggcggc 
atcagagcag ccgattgtct gfctgtgccca gtcatagccg aatagcctct ccacccaagc 

ggccggagaa cctgcgtgca atccatcttg ttcaatcatg cgaaacgatc cagatccggt 14940 

gcagattatt tggattgaga gtgaatatga gactctaatt ggataccgag gggaatttat 15000 

ggaacgtcag tggagcattt ttgacaagaa atatttgcta gctgatagfcg accttaggcg 15060 
acttttgaac gcgcaataat ggtttctgac gtafcgtgctt agctcattaa actccagaaa 
cccgcggctg agtggctcct tcaacgttgc ggttctgtca gttccaaacg taaaacggct 

tgtcccgcgfc catcggcggg ggtcataacg tgactccctt aattctccgc tcatgatcag 15240 

attgtcgttt cccgccttca gtttaaacta tcagtgtttg acaggatata ttggcgggta 15300 

aacctaagag aaaagagcgt ttattagaat aatcggatat ttaaaagggc gtgaaaaggfc 15360 

ttatccgttc gtccatttgt atgtgcatgc caaccacagg gttccccaga tctggcgccg 154^0 

gccagcgaga cgagcaagat tggccgccgc ccgaaacgat ccgacagcgc gcccagcaca 15480 

ggfcgngcagg caaattcrcac caacgcatac agcgccagca gaatgccata gtgggcggtg 15540 

acgtcgttcg agtgaaccag atcgcgcagg aggcccggca gcaccggcat aatcaggccg 15600 

atgccgacag cgtcgagcgc gacagtgctc agaattacga tcaggggtat gttgggfcttc 15660 

acgtctggcc tccggaccag cctccgctgg tccgattgaa cgcgcggatt ctttatcact 15720 

gataagttgg tggacatatt afcgtttatca gtgataaagt gtcaagcatg acaaagttgc 15780 

agccgaatac agtgatccgt gccgccctgg acctgttgaa cgaggtcggc gtagacggtc 15840 

tgacgacacg caaactggcg gaacggttgg gggttcagca gccggcgctt tactggcact 15900 

tcaggaacaa gcgggcgctg ctcgacgcac tggccgaagc catgctggcg gagaatcata 15950 
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cgcattcggt gccgagagcc gacgacgact ggcgctcatt tctgatcggg aatgcccgca 1602 0 
gcttcaggca ggcgcfcgctc goctaoogcg atgueflfiaRff catcaatCTCC ggcacgcgac 16080 
cgggcgcacc gcagatggaa acggccgacg cgcagcttcg cttcctctgc gaggcgggtt 16140 
tttcggccgg ggacgccgtc aatgcgctga tgacaatcag ctacttcact gttggggccg 16200 
tgcttgagga gcaggccggc gacagcgatg ccggcgagcg cggcggcacc gttgaacagg 16260 
ctccgctctc gccgctgttg cgggccgcga tagacgcctt cgacgaagcc ggtccggacg 16320 
cagcgttcga gcagggactc gcggtgattg tcgatggatt ggcgaaaagg aggctcgttg 16380 
tcaggaacgt tgaaggaccg agaaagggtg acgattgatc aggaccgctg ccggagcgca 16440 
acccactcac tacagcagag uc a tgt aga c aacatccoot ccccctttcc ar.r.gcafecag 16500 
acgcccgtag cagcccgcta cgggcttttt catgccctgc cctagcgtcc aagcctcacg 16560 
gccgcgctcg gcctctctgg cggccttctg gcgctcttcc gcttcctcgc tcactgactc 16620 
gctgcgctcg gtcgttcggc tgcggcgagc ggtatcagct cactcaaagg cggtaatacg 
gttatccaca gaatcagggg ataacgcagg aaagaacatg tgagcaaaag gccagcaaaa 
ggccaggaac cgtaaaaagg ccgcgttgct ggcgtttttc cataggctcc gcccccctga 16800 
cgagcatcac aaaaatcgac gctcaagtca gaggtggcga aacccgacag gactataaag 16860 
ataccaggcg tttCCCCCtg gaagctccct cgLgugctct ccfcgfctccga acotgccgcfc 16920 
taccggatac ctgtccgcct ttctcccttc gggaagcgtg gcgcttttcc gctgcataac 16980 
cctgcttcgg ggtcattata gcgattfcttt cggfcatatcc atcctttttc gcacgatata 17040 
caggathttg ccaaagggtt cgtgtagact ttccttggtg tatccaacgg cgtcagccgg 17100 
gcaggatagg tgaagtaggc ccacccgcga gcgggtgttc ettcttcact gtcccttatt 17160 
cgcacctggc ggtgctcaac gggaatcctg ctctgcgagg ctggccggct accgccggcg 17220 
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taacagatga gggcaagcgg atggctgatg aaaccaagcc aaccaggaag ggcagcccac 17280 

ctatoaaggt gtactgcott cragangaac g-aaaagcgat tgaggaaaag gcggcggcgg 17340 

ccggcatgag cctgtcggcc tacctgctgg ccgtcggcca gggctacaaa afccacgggcg 17400 

tcgtggacta tgagcacgtc cgcgagctgg cccgcatcaa tggcgacctg ggccgcctgg 17 4 SO 

gcggcctgct gaaactctgg ctcaccgacg acccgcgcac ggcgcggttc ggtgatgcca 17520 

cgatcctcgc cchgctggcg aagatcgaag agaagcagga cgagcttggc aaggtcatga 17580 

tgggcgtggt ccgcccgagg gcagagccat gactttttta gccgctaaaa cggccggggg 17640 

gtgcgcgtga ttgccaagca cgtccccatg cgctccatca agaagagcga cttcgcggag 17700 

Ctggtgaagt aratcaccga cgagcaaggc aagaoogago goefcttgccja «fffitca 17756 
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<400> 48 

ccgggctggt fegcoctcgccj gctgggctgg cggccgtrita tggccctgca aacgcgccag 60 

aaacgccgtc gaagccgfcgt gcgagacacc gcggccgccg gcgttgtgga tacctcgcgg 120 

aaaacttggc cctcactgac agatgagggg cggacgttga cacttgaggg gccgactcac 180 

ccggcgcggc gttgacagat gaggggcagg ctcgatttcg gccggcgacg tggagctggc 240 

cagcctcgca aatcggcgaa aacgcctgat tttacgcgag tttcccacag atgatgtgga 300 

caagcctggg gataagtgcc ctgcggtatt gacacttgag gggcgcgact actgacagat 360 

gaggggcgcg atccttgaca cttgaggggc agagtgctga cagatgaggg gcgcacctat 420 

tgaoatttga ggggctytcc aoaggcagaa aatccagcat ttgcaagggt tteegr-ncgt 480 

ttttcggcca ccgctaacct gtcttttaac ctgcttttaa accaatattt ataaaccttg 540 

tttttaacca gggctgcgcc ctgtgcgcgt gaccgcgcac gccgaagggg ggtgcccccc 600 

cttctcgaac cctcccggcc cgctaacgcg ggcctcccat ccccccaggg gctgcgcccc 660 
tcggccgcga acggcctcac cccaaaaatg gcagcgctgg cagtccttgc cattgccggg 720 
atcggggcag taacgggatg ggcgatcagc ccgagcgcga cgcccggaag cattgacgtg 780 
ccgcaggtgc tggcatcgac attcagcgac caggtgccgg gcagtgaggg cggcggcctg 840 
ggtggcggcc tgcccttcac ttcggccgtc gggguattca. cggacfcfccat ggcggggacg 900 

gcaattttta ccttgggcat tcttggcata gtggtcgcgg gtgccgtgct cgtgttcggg 960 

ggtgcgataa acccagcgaa ccatttgagg tgataggtaa gattataccg aggtatgaaa 1020 

acgagaattg gacctttaca gaattactcfc atgaagcgcc atatttaaaa agctaccaag 1080 

acgaagagga tgaagaggat gaggaggeag attgecttga atatattgac aatactgata 1140 
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agataatata tattttatat agaagatatc gccgtatgta aggatttcag ggggcaaggc 1200 

ataggcagcg cgcttatcaa tatatctata gaatgggcaa agcataaaaa cttgcatgga 1260 

ctaatgcttg aaacccagga caataacctt afcagcttgta aattctatca taattgggta 1320 

atgactccaa cttattgata gtgttttatg ttcagataat gcccgatgac tttgtcatgc 1380 

agctccaccg attttgagaa cgacagcgac ttccgUcca gccgtgccag gtgotgcctc 1440 

agattcaggt tatgccgctc aattcgctgc gtatatcgct tgctgattac gtgcagcttt 1500 

cccttcaggc gggattcata cagcggccag ccatccgtca tccatatcac cacgtcaaag 1560 

ggtgacagca ggctcataag acgccccagc gtcgccatag tgcgttcacc gaatacgtgc 1620 

gcaacaaccg tcttccggag actgtcatac gcgtaaaaca gccagcgctg gcgcgattta 1680 

gccccgacat agccccactg ttcgtccatt tccgcgcaga cgatgacgtc actgcccggc 1740 

tgtatgcgcg aggttaccga ctgcggcctg agttttttaa gtgacgtaaa atcgtgttga 1800 

ggccaacgcc cataatgcgg gctgttgccc ggcatccaac gccattcatg yucatatca* I860 

tgattttctg gtgcgtaccg ggttgagaag cggtgtaagt gaacfcgcagt tgccatgttt 1920 

tacggcagtg agagcagaga tagcgctgat gtccggcggt gcttttgccg ttacgcacca 1980 

ccccgtcagt agctgaacag gagggacagc tgatagacac agaagccact ggagcacctc 2040 

aaaaacacca tcatacacta aatcagtaag ttggcagcat cacccataat tgtggtttca 2100 

aaatcggctc cgtcgatact atgttatacg ccaactttga aaacaacttt gaaaaagctg ^ 2160 

ttbtctggta tttaaggttt hagaatgcaa ggaacagtga attggagttc gtcttgttat 2220 

aattagcttc ttggggtatc tttaaatact gtagaaaaga ggaaggaaat aataaatggc 22 80 

taaaatgaga atatcaccgg aattgaaaaa actgatcgaa aaataccgct gcgtaaaaga 2340 

tacggamgoa afcgtctcctg ctaaggtata taagctggtg ggagaaaatg aaaacctata 2400 
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tttaaaaatg acggacagcc ggtstaaagg gaccacctat gatgtggaac gggaaaagga 2460 

catgatgcta fcggctggaag gaaagctgcc tgttccaaag gtcctgcact ttgaacggca 2520 

tgatggctgg agcaatctgc tcatgagtga ggccgatggc gtcctttgct cggaagagta 2580 

tgaagatgaa caaagccctg aaaagattat cgagctgtat gcggagtgca tcaggctctt 2640 

tcactccatc gacatatcgg attgtcccta tacgaatagc ttagacagcc gcttag^ga. 2700 

attggattac ttactgaata acgatctggc cgatgtggat tgcgaaaact gggaagaaga 2760 

cactccattt aaagatccgc gcgagctgta tgatttttfca aagacggaaa agcccgaaga 2820 

ggaacttgtc ttttcccacg gcgacctggg agacagcaac atctttgtga aagatggcaa 2880 

agtaagtggc tttattgatc ttgggagaag cggcagggcg gacaagtggt atgacattgc 2940 

cttotgcgtc cggtcgatca gggaggatat cggggaagaa cagtatgtcg agctattttt 3000 

tgacttactg gggatcaagc ctgattggga gaaaataaaa tattatattt tactggatga 3060 

attgttttag tacctagatg tggcgcaacg atgccggcga caagcaggag cgcaccgact 3120 

tcttccgcat caagtgtttt ggctctcagg ccgaggccca cggcaagtat ttgggcaagg 3180 

ggtegctggt attcgtgcag ggcaagattc ggaataccaa gtacgagaag gacggccaga 3240 

cggtctacgg gaccgacttc attgccgata aggtggatta tctggacacc aaggcaccag 3300 

gcgggtcaaa tcaggaataa gggcacattg ccccggcgtg agtcggggca atcccgcaag 3360 

gagggtgaat gaatcggacg tttgaccgga aggcatacag gcaagaactg atcgacgcgg 3420 

ggttttccgc cgaggatgcc gaaaccatcg caagccgcac cgtcatgcgt gcgccccgcg 3480 

aaaccttcca gtccgtcggc tcgatggtcc agcaagctac ggccaagatc gagcgcgaca 3540 

gcgtgcaact ggctccccct gccctgcccg cgccatcggc cgccgtggag cgttcgcgtc 3 600 

gtctogaaca ggaggeggca ggtttggega aertcgatgac catcgacacg cgaggaacta 3660 
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tgacgaccaa gaagcgaaaa accgccggcg aggaccfcggc aaaacaggtc agcgaggcca 3720 

agcaggccgc gttgctgaaa cacacgaagc agcagatcaa ggaaatgcag ctttccttgt 3780 

fccgatattgc gccgtggccg gacacgatgc gagcgatgcc aaacgacacg gcccgctctg 3 840 

ccctgttcac cacgcgcaac aagaaaatcc cgcgcgaggc gcfcgcaaaac aaggtcattt 3300 

tccacgtcaa caaggacgtg aagatcacct acaccggcgt egagctgcgg gccgacgatg 39G0 

acgaactggt gtggcagcag gtgttggagt acgcgaagcg cacccctatc ggcgagccga 4020 

tcaccttcac gttctacgag ctttgccagg acctgggctg gtcgateaat ggccggtatt 4080 

acacgaaggc cgaggaatgc ctgtcgcgcc tacaggcgac ggcgatgggc ttcacgtccg 4140 

accgcgttgg gcacctggaa tcggtgtcgc tgctgcaccg cttccgcgtc ctggaccgtg 4200 

gcaagaaaac gtcccgttgc caggtcctga tcgacgagga aafccgtcgtg ctgtttgctg 4260 

gcgaccacta cacgaaattc atatgggaga agtaccgcaa gctgtcgccg acggcccgac 4320 

ggatgttcga ctatttcagc tcgcaccggg agccgtaccc gctcaagctg gaaaccttcc 4380 

gcctcatgtg cggatcggat tccacccgcg tgaagaagtg gcgcgagcag gfccggcgaag 4440 

ocfcgrgaaga gttgcgaggc agcggcctgg tggaacacgc ctgggtcaat gatgacctgg 4500 

tgcafctgcaa acgctagggc cttgtggggt cagttccggc tgggggttca gcagccagcg 4560 

ctttactggc atttcaggaa caagcgggca ctgctcgacg cacttgcttc gctcagtatc 4620 

gctcgggacg cacggcgcgc tctacgaact gccgataaac agaggattaa aattgacaat 4680 

tgtgattaag gctcagattc gacggcttgg agcggccgac gtgcaggatt tccgcgagat 4740 

ccgattgtcg gccctgaaga aagctccaga gatgttcggg tccgtttacg agcacgagga 4800 

gaaaaagccc atggaggcgt tcgctgaacg gttgcgagat gccgtggcat tcggcgccta 4860 

catcgacggc gagatcattg ggctgtcggt cttcaaacag gaggacggcc ccaaggacgc 4920 
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tcacaaggcg catctgtccg gcgttttcgt ggagcccgaa cagcgaggcc gaggggtcgc 4980 

cgah.i-.gcta ctgcgggcat tgccggcggg tttattgctc gtgatgatcg tccgacagat 5040 

tccaacggga atctggtgga tgcgcatctt catcctcggc gcacttaata tttcgctatt 5100 

ctggagcttg ttgtttattt cggtctaccg cctgccgggc ggggtcgcgg cgacggtagg 5160 

cgctgtgcag ccgctgatgg tcgtgttcat ctctgccgct ctgctaggta gcccgatacg 5220 

atfcgatggcg gtcctggggg ctatttgcgg aactgcgggc gtggcgctgt tggtgttgac 5280 

accaaacgca gcgctagatc ctgtcggcgt cgcagcgggc ctggcggggg cggtttccat 5340 

ggcgttcgga accgtgctga cccgcaagtg gcaacctccc gtgcctctgc tcacctttac 5400 
egectggoaa ot W egofifia gaggacttct gctcgttcca gtagctttag tgtttgatcc 5460 
gccaatcccg atgcctacag gaaccaatgt tctcggcctg gcgtggctcg gcctgatcgg 5520 
agcgggttta acctacttcc tttggttccg ggggatctcg cgactcgaac ctacagttgt 5580 
ttccttactg ggctttctca gccccagatc tggggtcgat cagccgggga tgcatcaggc 5640 
cgacagtcgg aacttcgggt ccccgacctg taccattcgg tgagcaatgg ataggggagt 5700 
tgatatcgtc aacgttcact tctaaagaaa tagcgccact cagcttcctc agcggcttta 5760 
tccagcgatt tcctattatg tcggcatagt tctcaagatc gacagcctgt cacggttaag 5820 
cgagaaatga atwgocggo tgataatteg gatctctgca agggagatga tatttgatca 5880 
caggcagcaa cgctctgtca tcgttacaat caacatgcta ccctccgcga gatcatccgt 5940 
gtttcaaacc cggcagctta gttgccgttc ttccgaatag catcggtaac atgagcaaag 6000 
tctgccgcct tacaacggct ctcccgctga cgccgtcccg gactgatggg ctgcctgtat 6060 
cgagtggtga ttttgtgccg agctgccggt cggggagcfcg ttggctggct ggtggcagga 6120 
tatattgtgg tgtaaacaaa ttgacgctta gacaacttaa taacacattg cggacgtttt 6180 
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taatgtactg gggtggtttt tcttttcacc agtgagacgg gcaacagctg attgcccttc 6240 

accgcctggc cctgagagag ttgcagcaag cggtccacgc tggtttgccc cagcaggcga S3 00 

aaatcctgtt tgatggtggt tccgaaatcg gcaaaatccc ttataaatca aaagaatagc 6360 

ccgagatagg gttgagtgtt gttccagttt ggaacaagag tccactatta aagaacgtgg 6420 

actccaacgt caaagggcga aaaaccgtct atcagggcga tggcccacta cgtgaaccat 6480 

cacccaaatc aagttttttg gggtcgaggt gccgtaaagc actaaatcgg aaccctaaag 6540 

ggagcccccg atttagagct tgacggggaa agccggcgaa cgtggcgaga aaggaaggga 6600 

agaaagcgaa aggagcgggc gccattcagg ctgcgcaact gttgggaagg gcgatcggtg 6660 

cgggectcfcfc ngctattacg ccaactggcg aaagggggat gtgctgcaag gcgattaagfc 6720 

fcgggtaacgc cagggttttc ccagtcacga cgttgtaaaa cgacggccag tgaattcgag 6780 
ctcggtaccc ggggatcttt cgacactgaa atacgtcgag cctgctccgc ttggaagcgg 6840 
cgaggagcct cgtcctgtca caactaccaa catggagtac gataagggcc agttccgcca 6900 
gctcattaag agccagttca tgggcgttgg catgatggcc gtcatgcatc tgtacttcaa 6960 
gtacaccaac gctcttctga tccagtcgat catccgctga aggcgctttc gaatctggtt 7020 
aagatccacg tcttcgggaa gccagcgact ggtgacctcc agcgtccctt taaggctgcc 7080 
aacagcttta taagccaggg ccagcccaag accgacaagg cctccctcca gaacgccgag 7140 
aagaactgga ggggtggtgt caaggaggag taagctcctt attgaagtcg gaggacggag 7200 
cggtgtcaag aggatattct tcgactctgt attatagata agatgatgag gaattggagg 7260 
tagcatagct tcatttggat ttgctttcca ggctgagact ctagcttgga gcatagaggg 7320 
tcctttggct ttcaatattc tcaagtatct cgagtttgaa cttattccct gtgaaccttt 7380 
tattcaccaa tgagcattgg aatgaacatg aatctgagga ctgcaatcgc catgaggttt 7440 
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tcgaaataca tccggatgtc gaaggcfctgg ggcacctgcg ttggttgaat ttagaacgtg 7500 

gcactattga tcatccgata gctctgcaaa gggcgttgca caatgcaagt caaacgttgc 7560 

tagcagttcc aggtggaatg ttatgatgag cattgtatta aatcaggaga tatagcatga 7620 

tctctagtta gctcaccaca aaagtcagac ggcgtaacca aaagtcacac aacacaagct 7680 

gtaaggattt cggcacggct acggaagacg gagaagccac cttcagtgga ctcgagtacc 7740 

atttaattct atttgtgttt gatcgagacc taatacagcc cctacaacga ccatcaaagt 7800 

cgtatagcta ccagtgagga agtggactca aatcgacttc agcaacatct cctggataaa 7860 

ctttaagcct aaactataca gaataagata ggtggagagc ttataccgag ctcccaaatc 7920 

fcgtrsnraerat-.r. atogttaacc ggtscctgga tcttcctata gaatcatcct tattcgttga 7980 

cctagcfcgat tctggagtga cccagagggt catgacttga gcctaaaatc cgccgccfccc 8040 

accabttgta gaaaaatgtg acgaactcgt gagctctgta cagtgaccgg tgactctttc 8100 

tggcatgcgg agagacggac ggacgcagag agaagggctg agtaataagc cactggccag 8160 

acagctctgg cggctctgag gtgcagtgga tgattattaa tccgggaccg gccgcccctc 8220 

cgccccgaag tggaaaggct ggtgtgcccc tcgttgacca agaatctatt gcatcatcgg 8280 

agaatatgga gcttcatcga atcaccggca gtaagcgaag gagaafcgtga agccaggggt 8340 

gtatagcogt; cggogaaata gcatgccafct aannhfjggha oagaagtcca attgcttccg 8400 

atctggtaaa agafctcacga gatagtacct tctccgaagt aggtagagcg agtacccggc 8460 

gcgtaagctc cctaattggc ccatccggca tctgtagggc gtccaaatat cgtgcctctc 8520 

ctgctttgcc cggtgtatga aaccggaaag gccgctcagg agctggccag cggcgcagac 8580 

cgggaacaca agctggcagt cgacccatcc ggtgctctgc actcgacctg ctgaggtccc 8640 



WO 2004/063358 PCT/EP2004/000100 
269/358 

tcagtcccfcg gtaggcagct ttgccccgtc tgtccgcccg gfcgtgtcggc ggggttgaca 8700 

aggtcgttgc gtcagtccaa catttgttgc catattttcc tgctctcccc accagctgct 8760 

cttttctttt ctctttcttt tcccatcttc agtatattca tcttcccatc caagaacctt 8820 

tatttcccct aagfcaagtac tttgctacat ccatactcca tccttcccat cccttattcc 8880 

tttgaacctt fccagttcgag ctttcccact tcatcgcagc ttgactaaca gctaccccgc 8940 

ttgagcagac atcaccatgc ctgaactcac cgcgacgtct gtcgagaagt ttctgatcga 9000 

aaagttcgac agcgtctccg acctgatgca gctctcggag ggcgaagaat ctcgtgcttt 9060 

cagcttcgat gtaggagggc gtggatatgt cctgcgggta aatagctgcg ccgatggttt 9120 

ctacaaagat cgttatgttt atcggcactt tgcatcggcc gcgctcccga ttccggaagt 9180 

gcttgacatt ggggaattca gcgagagcct gacctattgc atctcccgcc gtgcacaggg 9240 

tgtcacgttg caagacctgc ctgaaaccga actgcccgct gttctgcagc cggtcgcgga 9300 

ggrtnafcercrat gcgatcgctg cggccgatct tagccagacg agcgggttcg gcccattcgg 9360 

accgcaagga atcggtcaat acactacatg gcgtgatttc atatgcgcga ttgctgatcc 9420 

ccatgtgtat cactggcaaa ctgtgatgga cgacaccgtc agtgcgtccg tcgcgcaggc 9480 

tctcgatgag ctgafcgcttt gggccgagga ctgccccgaa gtccggcacc tcgtgcacgc 9540 

ggatttcggc tccaacaatg tcctgacgga caatggccgc ataacagcgg tcattgactg 9600 

gagcgaggcg atgttcgggg attcccaata cgaggtcgcc aacatcttct tctggaggcc 9660 

gtggttggct tgtatggagc agcagacgcg ctacttcgag cggaggcatc cggagcttgc 9720 

aggatogocg aggctccggg agtatafcgofc nngr.atfcggt nttgacnaac tctatcagag 9780 

cttggttgac ggcaatttcg atgatgcagc ttgggcgcag ggtcgatgcg acgcaatcgt 9840 

ccgatccgga gccgggactg tcgggcgtac acaaatcgcc cgcagaagcg cggccgtctg 9900 
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gaccgatggc tgtgtagaag tactegccga tagtggaaac cgacgcccca gcactcgtcc 9960 

gagggcaaag gaatagagta gatgccgacc gcgggatcga tccacttaac gttactgaaa 10020 

tcatcaaaca gcttgacgaa tctggatata agatcgfctgg tgtcgatgto agcfcccggag 1008U 

ttgagacaaa tggtgttcag gatctcgata agatacgttc atttgtccaa gcagcaaaga 10140 

gtgccttcta gtgahttaat agctccatgt caacaagaat aaaacgcgfct ttcgggttta 10200 

cctcttccag atacagctca tctgcaatgc attaafcgcat tgactgcaac ctagtaacgc 10260 

cttncaggct ccggcgaaga gaagaatagc ttagcagagc tattttcatt ttcgggagac 10320 

gagatcaagc agatcaacgg tcgtcaagag acctacgaga ctgaggaatc cgctcttggc 10380 

tccacgcgac tatatatttg' tctctaattg tactttgaca tgctcctctt ctttactctg 10440 

afcagcttgac tatgaaaatt ccgtcaccag cncctgggtt cgcaaagata attgcatgtt 10500 

tcttccttga actctcaagc ctacaggaca cacattcatc gtaggtataa acctcgaaat 10560 

eianttcctac taagatggta tacaatagta accatgcatg gttgcctagt gaatgctccg 10620 

taacacccaa tacgccggcc gaaacttttt tacaactctc ctatgagtcg tttacccaga 10680 

atgcacaggt acacttgttt agaggtaatc cttctttcta gctagaagtc ctcgtgtacfc 10740 

gtgtaagcgc ccactccaca tctccactcg acctgcaggc atgcaagctt gagattaaaa 10800 

tagataagga aaagaaagtg aaaagaaatt cggaagcatg gcacattctt ctttttataa 10860 

atacatgcct gactttcttt ttccatcgat atgatatatg catatgatag atatacaagc 10920 

aatcttcttc aaggagtttg aaattttgtc ctccaggagc aaaaaaaagt ttttttttat 10980 

acatgtttgb aoaoaagaat agttaccaat fctgettfcggt cttacgtgct gcaagtttat 11040 

atcgttttca atttctttgt ctttacattt tctttgtcct ttatctttcc tcatttagtc 11100 

tttgggagaa ttaggaaaag ggagcggaaa ggtaagaaat gcttgcgtat tttactaatt 11160 
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cggcaaacat ccaatttggc aaacagcagc ctgtgcaacg ctctcgagat gacagtatcfc 11220 

ttgattacac tctaaatctc gatgacccga ccaaaaagag cgaacaaaga aataatcttg 11280 

tgcattcgaa tatgatggaa gattttttcc cccttattct aaatgttgac atagcgtgta 11340 

tgttatataa acaaaaagaa attgtacaaa ctttettttc ttctcttttt afctttatctc 11400 

tatgatccag ttagaacaac cactcagtca tcaagcaaaa ctgactccag tactgagaag 11460 

taaatctcag tttaaggggc ttttcattgc tattgtcatt gttagcgcat gggfccattag 11520 

cctgagttta ttactttccc ttgacatctc aaagctaaaa ttttggatgt tattgcctgt 11580 

tatactatgg caaacatttt tatatacggg attatttatt acatctcatg atgccatgca 11640 

tggcgtagta tttccccaaa acaccaagat taatcatttg attggaacat tgaccctatc 11700 

cctttatggt cttttaccat atcaaaaact attgaaaaaa catbggttac accaccacaa 11760 

tccagcaagc fccaatagacc cggattttca caatggtaaa caccaaagtt tatttgcttg 11820 

gtattttcat tttatgaaag gttactggag ttgggggcaa ataattgcgt tgactattat 11880 

ttataacttt gctaaataca tactccatat cccaagtgat aatctaactfc acttttgggt 11940 

gctaccctcg cttttaagtt cattacaatt attctatttt ggtactfcttt taccccatag 12000 

tgaaccaata gggggttatg ttcagcctca ttgtgcccaa acaattagcc gtcctatttg 12060 

gtggtcattt atcacgtgct atcattttgg ctaccacgag gaacatcacg aatatcctaa 12120 

fcatttcttgg tggcagttac cagaaattta caaagcaaaa tagaagcttg gcgtaatcat 12180 

ggtcatagct gtttcctgtg tgaaattgtt atccgctcac aattccacac aacatacgag 12240 

nnggaageat aaagfcgtaaa gcctggggtg cctaatgagt gagctaactc acattaattg 12300 

cgttgcgctc actgcccgct ttccagtcgg gaaacctgtc gtgccagctg cattaatgaa 12360 

tcggccaacg cgcggggaga ggcggtttgc gtattgggcc aaagacaaaa gggcgacatt 12420 
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caaccgattg agggagggaa ggtaaatatt gacggaaatt attcattaaa ggtgaattat 12480 

caccgtcacc gacttgagcc atttgggaat tagagccagc aaaatcacca gtagcaccat 12540 

taccattagc aaggccggaa acgtcaccaa tgaaaccatc gatagcagca ccgtaatcag 12600 

tagcgacaga atcaagtttg cctttagcgt cagactgtag cgcgttttca tcggcatttt 12660 

cggtcatagc ccccttatta gcgtttgcca tcttttcata atcaaaatca ccggaaccag 12720 

agccaccacc ggaaccgcct ccctcagagc cgccaccctc agaaccgcca ccctcagagc 12780 

caccaccctc agagccgcca ccagaaccac cacccigagcc gccgccagca ttgacaggag 12 840 

gcccgatcta gtaacataga tgacaccgcg cgcgataatt tatcctagtt tgcgcgctat 12900 

attttgtttt ctatcgcgta ttaaatgtat aattgcggga ctctaatcat aaaaacccat 12960 

ctcataaata acgtcatgca ttacatgtta attattacat gcttaacgta attcaacaga 13020 

aattatatga taatcatcgc aagaccggca acaggattca atcttaagaa actttattgc 13080 

caaatgtttg aacgatcggg gatcatccgg gtctgtggcg ggaactccac gaaaatatcc 13140 

gaacgcagca agatatcgcg gtgcatctcg gtcttgcctg ggcagtcgcc gccgacgccg 13200 

ttgatgtgga cgccgggccc gatcatattg tcgctcagga tcgtggcgtt gtgcttgtwg 13260 

gccgttgctg tcgtaatgat atcggcacct tcgaccgcct gttccgcaga gatcccgtgg 13320 

gogaagaact ccagcatgag atccccgcgc tggaggatca tccagccggc gtcccggaaa 13380 

acgattccga agcccaacct fctcatagaag gcggcggtgg aatcgaaatc tcgtgatggc 13440 

aggttgggcg fccgcttggtc ggtcatttcg aaccccagag tcccgctcag aagaactcgt 13500 

caagaaggcg atagaaggcg atgcgctgcg aatcgggagc ggcgataccg taaagcacga 13560 

ggaagcggtc agcccattcg ccgccaagct cttcagcaat atcacgggta gccaacgcta 13620 

tgtcctgata gcggtccgca aoaccoagcc ggccacagtc gatgaatcca gaaaagcggc 13680 
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cattttccac catgatattc ggcaagcagg catcgccatg ggtcacgacg agatcatcgc 13740 

cgtcgggcafc gcgcgccttg agccfcggcga acagttcggc tggcgcgagc ccctgatgct 13800 

cttcgtccag atcatcctga tcgacaagac cggcttccat ccgagtacgt gctcgctcga 13860 

tgcgatgttfc cgcttggtgg tcgaatggga aggtagccgg atcaagcgta tgcagccgcc 13920 

gcattgcatc agccatgatg gatachttct cggcaggagc aaggtgagat gacaggagat 13980 

cctgccccgg cacttcgccc aatagcagcc agtcccttcc cgcttcagtg acaacgtcga 14040 

gcacagctgc gcjetciggeicicy cacgtcgtgg ccagccacgo tagccgcgct gcctcgtcct 14100 

gcagtfccatt cagggcaccg gacaggtcgg tcttgacaaa aagaaccggg cgcccctgcg 14160 

ctgacagccg gaacacggcg gcatcagagc agccgattgt ctgttgtgcc cagtcatagc 14220 

cgaatagcct ctccacccaa gcggccggag aacctgcgtg caatccatct tgttcaatca 14280 

tgcgaaacga tccagatccg gtgcagatta tttggatfcga gagtgaatat gagactctaa 14340 

ttggataccg aggggaattt atggaacgtc agtggagcat ttttgacaag aaatatttgc 14400 

tagctgatag tgaccttagg cgacttttga acgcgcaata atggtttctg acgtatghgc 14460 

thagctcatt aaactccaga aacccgcggc tgagcggctc cttcaacgtt guggttctyL 14520 

cagttccaaa cgtaaaacgg cttgtcccgc gtcatcggcg ggggtcataa cgtgactccc 14580 

ttaattctcc gctcatgatc agattgtcgt ttcccgcctt cagtfctaaac tatcaghgfct 14640 

tgacaggata tattggcggg taaacctaag agaaaagagc gtttattaga ataatcggat 14700 

atttaaaagg gcgtgaaaag gtttatccgt tcgtccattt gtatgtgcat gccaaccaca 14760 

gggttcccca' gatctggcgc cggccagcga gacgagcaag attggccgcc gcccgaaacg 14820 

atccgacagc gcgcccagca caggtgcgca ggcaaattgc accaacgcat acagcgccag 14880 

cagaatgcca tagtgggcgg tgacgtcgtt cgagtgaacc agatcgcgca ggaggcccgg 14940 
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cagcaccggc ataatcaggc cgatgccgac agcgtcgagc gcgacagtgc tcagaattac 15000 

gatcaggggt atgttgggtt tcacgtctgg cctccggacc agcctccgct ggtccgattg 15060 

aacgcgcgga ttctttatca ctgataagtt ggtggacata ttatgtttat cagtgataaa 15120 

gtgtcaagca tgacaaagtt gcagccgaat acagtgatcc gtgccgccct ggacctgttg 15180 

aacgaggtcg gcgtagacgg tctgacgaca cgcaaactgg cggaacggtt gggggttcag 15240 

cagccggcgc tttactggca cttcaggaac aagcgggcgc tgctcgacgc actggccgaa 15300 

gccatgctgg cggagaatoa. Lacgceittcg gtgccgagag ccgaogaoga otggcgctaa 15360 

tttctgatcg ggaatgcccg cagcttcagg caggcgctgc tcgcctaccg cgatggcgcg 15420 

cgcatccatg ccggcacgcg accgggcgca ccgcagatgg aaacggccga cgcgcagctt 15480 

cgcttcctct gcgaggcggg tttttcggcc ggggacgccg tcaatgcgct gatgacaatc 15540 

agctacttca ctgttggggc cgtgcttgag gagcaggocg gcgacagcga tgcicggcgag 15600 

cgcggcggca ccgttgaaca ggctccgctc tcgccgctgt tgcgggccgc gatagacgcc 15660 

ttcgacgaag ccggtccgga cgcagcgttc gagcagggac tcgcggtgat tgtcgahgga 15720 

ttggcgaaaa ggaggctcgt tgtcaggaac gttgaaggac cgagaeieiLjyg t-gctcgattga 15700 

tcaggaccgc tgccggagcg caacccactc actacagcag agccatgtag acaacatccc 15840 

ctcccccttt ccaccgcgtc agacgcccgt agcagcccgc tacgggcttt ttcatgccct 15900 

gccctagcgt ccaagcctca cggccgcgct. cggcctctct ggcggccttc tggcgctctt 15960 

ccgcttcctc gctcactgac tcgctgcgct cggtcgttcg gctgcggcga gcggtatcag 16020 

ctcactcaaa ggcggtaata cggttatcca cagaatcagg ggataacgca ggaaagaaca 16080 

tgtgagcaaa aggccagcaa aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt 16140 

tccataggct ccgcccccct gacgagcatc acaaaaatcg acgctcaagt cagaggtggc 15200 
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gaaacccgac aggactafcaa agataccagg cgfcttccccc t'ggaagctcc ctcgtgcgct 16260 

ctcctgttcc gaccctgccg cttaccggat acctgtccgc ctttctccct tcgggaagcg 16320 

tggcgctttt ccgctgcata accctgcttc ggggtcatta tagcgafcttt ttcggtatat 16380 

ccatcctttt tcgcacgata tacaggafcfct tgccaaaggg ttcgtgtaga ctttccttgg 16440 

tgtatccaac ggcgtcagcc gggcaggata ggtgaagtag gcccacccgc gagcgggfcgt 16500 

tccttcttca ctgtccctta ttcgcacctg gcggtgctca acgggaatcc tgctctgcga 16560 

ggctggccgg ctaccgccgg cgtaacagat gagggcaagc ggatggctga tgaaaccaag 16620 

ccaaccagga agggcagccc acctatcaag gtgtactgcc ttccagacga acgaagagcg 16680 

attgaggaaa aggcggcggc ggccggcatg agcctgtcgg cctacctgct ggccgtcggc 16740 

cagggctaca aaatcacggg cgfccgtggac tatgagcacg tccgcgagct ggcccgcatc 16800 

aatgacaaac tgsgccgcct gggrcggcctg ctgaaactct ggctcaccga cgacccgcgc 16860 

acggcgcggt tcggtgatgc cacgatcctc gccctgctgg cgaagatcga agagaagcag 16920 

gacgagcttg gcaaggtcat gatgggcgtg gtcegcccga gggcagagcc atgacttttt 16980 

tagccgctaa aacggccggg gggtgcgcgt gattgccaag cacgtcccca tgcgctccat 17040 

caagaagagc gacttcgcgg agctggtgaa gtacatcacc gacgag'caag gcaagaccga 17100 

gcgcctttgc gacgctca 17118 

<210> 49 
<2X1n 18449 
<212> DNA 
<213> Artificial 
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<223> Plasmid 
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<220> 

<221> misc_feature 
<222> (3471) .. (3471) 

<223> n is a, c, g, or t 

<220> 

<221> mis cofeature 

<222> (3679) .. (3679) 

<223> n is a, c, g, or t 

<220> 

<221> misc_feature 

<222> (3770) .. (3770) 

<223> n is a, c, g, or t 

<400> 49 

gatctttcga cactgaaata cgtcgagcct gctccgcttg gaagcggcga ggagcctcgt 60 

cctgtcacaa ctaccaacat ggagtacgat aagggccagt tccgccagct cattaagagc 12 0 

cagttcatgg gcgttggcat gatggccgtc atgcatctgt acttcaagta caccaacgct 180 

cttctgatcc agtcgatcat ccgctgaagg cgctttcgaa tcfcggttaag atccacgfcct 240 

tcgggaagcc agcgactggt gacctwagc gLcccLtLaa ggctgcuaac ayctttctcei 300 

gccagggcca gcccaagacc gacaaggcct ccctccagaa cgccgagaag aactggaggg 360 

gtggtgtcaa ggaggagtaa gctccttatt gaagtcggag gacggagcgg tgtcaagagg 420 

atattcttcg actctgtatt atagataaga tgatgaggaa ttggaggtag catagcttca 480 

tttggatfctg ctttccaggc tgagactcta gctfcggagca tagagggtcc tttggctttc 540 

aatattctca agtatctcga gtttgaactt attccctgtg aaccttttafc tcaccaatga 600 

gcattggaafe gaacatgaat ctgaggactg caatcgccat gaggttttcg aaatacatcc 660 

ggatgtcgaa ggcttggggc acctgcgttg gttgaattta gaacgtggca ctattgatca 720 
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tccgatagct ctgcaaaggg cgttgcacaa tgcaagtcaa acgttgctag cagttccagg 780 
tggaatgfcta tgatgagcat tgtattaaat caggagatat agcatgatct ctagttagct 840 
caccacaaaa gtcagacggc gtaaccaaaa gtcacacaac acaagctgta aggatttcgg 900 
cacggctacg gaagacggag aagccacctt cagtggactc gagfcaccatt taattctatt 960 

tgtgtttgat cgagacctaa tacagcccct acaacgacca tcaaagtcgt atagctacca 1020 

gtgaggaagt ggactcaaat cgacttcagc aacafcctcct ggataaactt taagcctaaa 1080 

Ctatacagaa taagataggt gyciyctyct.t<a. taccgagctc ccaaatctgt ccagatoatg 1140 

gttgaccggt gcctggatct tcctatagaa tcatccttat tcgttgaect agctgattct 12 00 

ggagtgaccc agagggtcat gacttgagcc taaaatccgc cgcctccacc afcttgtagaa 1260 

aaatghgacg aactcgtgag ctctgtacag tgaccggtga ctctttctgg catgcggaga 1320 

gacggacgga cgcagagaga agggctgagt aataagccac tggccagaca gctctggcgg 1380 

ctctgaggtg cagtggatga ttattaatcc gggaccggcc gcccctccgc ccogaagtgg 1440 

aaaggctggt gtgcccctcg ttgaccaaga atctattgca tcatcggaga atatggagct 1500 

tcatcgaatc accggcagta agcgaaggag aatgtgaagc caggggtgta. teiyccytcgg 15S0 

cgaaatagca tgccattaac ctaggtacag aagtccaatt gcttccgatc tggtaaaaga 1620 

ttcacgagat agtaccttct ccgaagtagg tagagcgagt acccggcgcg fcaagctccct 1680 

aattggccca tccggcatct gtagggcgtc caaatatcgt gcctctcctg ctttgcccgg 1740 

tgtatgaaac cggaaaggcc gctcaggagc tggccagcgg cgcagaccgg gaacacaagc 1800 

tggcagtcga cccatccggt gctctgcact cgacctgctg aggtccctca gtccctggta 1860 
ggcagctttg ccccgtctgt ccgcccggtg tgtcggcggg gttgacaagg tcgttgcgtc 1920 
agtccaacat ttgttgccat attttcctgc tctccccacc agctgctctt ttcttttctc 1980 
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tttcttttcc catcttcagt atattcatct tcccatccaa gaacctttat ttcccctaag 2 040 

taagtacttt gctacatcca tactccatcc ttcccatccc ttattccttt gaacctttca 2100 

gttcgagctt tcccacttca tcgcagcttg actaacagct accccgcttg agcagacatc 2160 

accatgcctg aactcaccgc gacgtctgtc gagaagtttc tgatcgaaaa gttcgacagc 2220 

gtctccgacc tgatgcagct ctcggagggc gaagaatctc gtgctttcag cttcgafcgta 22 BO 

ggagggcgtg gatatgtcct gogggtaaat agctgcgccg atggtttcta caaagatcgfc 2340 

tatgtttatc ggcactXtgc atcggecgcg ctcocgattc cggaagtgct tgacabtggg 240 0 

gaattcagcg agagcotgac ctattgcatc tcccgccgtg cacagggtgt cacgttgcaa 2460 

gacctgcctg aaaccgaact gcccgctgtt ctgcagccgg tcgcggaggc catggatgcg 2520 

■ atcgctgcgg ccgatcttag ccagacgagc gggttcggcc cattcggacc gcaaggaatc 2580 

ggtcaataca ctacatggcg tgatttcata tgcgcgattg ctgatcccca tgtgtatcac 2640 

tggcaaactg tgatggacga caccgtcagt gcgtccgtcg cgcaggctct cgatgagctg 2700 

atgctttggg ccgaggactg ccccgaagtc cggcacctcg tgcacgcgga tttcggctcc 2760 

aacaatgtcc tgacggacaa tggccgcata acagcggtca ttgactggag cgaggcgafcg 2820 

ttcggggatt cccaatacga ggtcgccaac atcttcttct ggaggccgtg gttggcttgt 2880 

atggagcagc agacgcgcta cttcgagcgg aggcatccgg agcttgcagg atcgccgcgg 2940 

cfcccgggcgt atatgctccg cattggtctt gaccaactct atcagagctt ggttgacggc 3000 

aatttogatg atgcagcttg ggcgcagggt cgatgcgacg caatcgtccg atccggagcc 3060 

gggactgtcg ggcgtacaca aatcgcccgc agaagcgcgg ccgtctggac cgatggctgt 3120 

gtagaagtac tcgccgatag tggaaaccga cgccccagca ctcgtccgag ggcaaaggaa 3180 

tagagtagat gccgaccgcg ggatcgatcc acttaacgtt actgaaatca tcaaacagct 3240 
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tgacgaatct ggatataaga tcgttggtgt cgatgtcagc tccggagttg agacaaatgg 3300 

tgttcaggat ctcgataaga tacgttcatt tgtccaagca gcaaagagtg ccttctagtg 3360 

atttaatagc tccatgtcaa caagaataaa acgcgttttc gggtttacct cttccagata 3420 

cagctcatct gcaatgcatt aatgaattga ctgcaaccta gtaacgcctt ncaggctccg 3480 

gcgaagagaa gaatagctta gcagagctat tttcattttc gggagacgag atcaagcaga 3540 

tcaacggtcg tcaagagacc tacgagactg aggaatccgc tcttggctcc acgcgactat 3600 

atatttgtct ctaattgfcac tttgacatgc tcctcttctt tactctgata gcttgactat 3660 

gaaaattccg tcaccagcnc ctgggttcgc aaagataatt gcatgtttct tccttgaact 3720 

' ctcaagccta caggacacac attcatcgta ggtataaacc tcgaaatcan ttcctactaa 3780 

gatggtatac aafcagtaacc atgcatggtt gcctagtgaa tgctccgtaa cacccaatac 3840 

gaoggocgaa aotfchhtfcac aactctccta teragfccgttt acccagaatg cacaggtaca 3900 

cttgtttaga ggtaatcctt ctttctagct agaagtcctc gtgtactgtg taagcgccca 3960 

cfcccacatct ccactcgacc tgcaggcatg caaagcttga gattaaaata gataaggaaa 4020 

agaaagtgaa aagaaattcg gaagcatggc acattcttct ttttataaat acatgcctga 4080 

ctttcttttt ccatcgatat gatatatgca tatgatagat atacaagcaa tcttcttcaa 4140 

ggagtttgaa attttgtcct ccaggagcaa aaaaaagttt ttttttatac atgtttgfcafa 4200 

acaagaatag ttaccaattt gctttggtct tacgtgctgc aagtttatat cgttttcaat 4260 
ttcfcttgfcct ttacatttfce tttgtccttt atetttcctc atttagtctt tscjcjacraatt 4320 
aggaaaaggg agcggaaagg taagaaatgc ttgcgtattt tactaattcg gcaaacatcc 4380 
aatttggcaa acagcagcct gtgcaacgct ctcgagatga cagtatcttt gattacactc 4440 
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taaatctcga tgacccgacc aaaaagagcg aacaaagaaa taatcttgtg cattcgaata 4500 

tgatggaaga ttttttcccc cttattctaa atgttgacat agcgtgtatg ttatataaac 4560 

aaaaagaaat tgtacaaact ttcttttctt ctctttttat tttatetcta tgctgtcgaa 4620 

gctgcagtca atcagcgtca aggcccgccg cgttgaacta gcccgcgaca tcacgcggcc 4680 

caaagfcctgc ctgcatgctc agcggtgctc gttagttcgg cfcgcgagtgg cagcaccaca 4740 

gacagaggag gcgctgggaa ccgtgcaggc tgccggcgcg ggcgatgagc acagcgccga 4800 

tgtagcactc cagcagcttg accgggctat cgcagagcgt cgtgcccggc gcaaacggga 4860 

gcagctgtca taccaggctg ccgccattgc agcatcaatt ggcgtgtcag gcattgccat 4920 

cttcgccacc tacctgagat ttgccafcgca catgaccgtg ggcggcgcag tgccatgggg 4980 

tgaagtggct ggcactctcc tcttggtggt tggtggcgcg ctcggcatgg agatgtatgc 5040 

ccgctatgca cacaaagcca tctggcatga gtcgcctctg ggctggcfcgc tgcacaagag 5100 

ccaeoacaca cnfeegcactg gaccctttga agccaacgac ttgtttgcaa tcatcaafcgg 5160 
actgcccgcc atgctcctgt gtacctttgg cttctggctg cccaacgtcc tgggggcggc 5220 
ctgctttgga gcggggctgg gcatcacgct atacggcatg gcatatatgt ttgtacacga 5280 
tggcctggtg cacaggcgct ttcccaccgg gcccatcgct ggcctgccct acatgaagcg 5340 
cctgacagtg gcccaccagc tacaccacag cggcaagtac ggtggcgcgc cctggggtat 5400 
gttcfctgggt ccacaggagc tgcagcacat tccaggtgcg gcggaggagg tggagcgact 5460 
ggfccctggaa ctggactggt ccaagcgggc gafctgtgact gatagcgaga ctctgggtcg 5520 
atgttatcfcg ootoaaoaat ggottagaaa agaagaaaca gaacaaatac agcaaggcaa 5580 
cgcccgtagc ctaggtgatc aaagactgtt gggcttgtct ctgaagcttg taggaaaggc 5640 
agacgctatc atggtgagag ctaagaaggg cattgacaag ttgccggcaa actgtcaagg 5700 
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cggtgtacga gctgcttgcc aagtatatgc tgcaattgga tctgtactca agcagcagaa 5760 

gacaacatat cctacaagag ctcatctaaa aggaagcgaa cgtgccaaga ttgctctgtt 5 820 

gagtgtatac aacctctatc aafcctgaaga caagcctgtg gctctccgtc aagctagaaa 5880 ■ 

gattaagagt ttttttgttg attagtgaat ttttgtttta tttatgtctg atagfctcaat 5940 

aaacraaacaa cacatacaat ataaaatcat tgtctttaaa tgttaattta gtagagtgta 6000 

aagcctgcat ttttttfcgta cgcataaaca atgaattcac cccgcttctg gtttttaaat 6060 

aattatgtca aactagggaa aattcttttt tttctcttcg ttcttttttt ggcttgttgt 6120 

ggagtcacag gcttgtcttc agattgatag aggttgtata cactcaacag agcaatcttg 6180 

gcacgttcgc ttccttttag atgagctctt gtaggatatg ttgtcttctg ctgcttgagt 6240 

acagatccaa ttgcagcata tacttggcaa gcagctcgta caccgccttg acagtttgcc 6300 

ggcaacttgt caatgccctt cttagctctc accatgatag cgtctgcctt tcctacaagc , 6360 
tfccagagaea agcccaacaa tctttgatca cctaggctac gggcgttgcc ttgctgtatt 6420 
tgttctgttt cttcttttct aagccattgt tgaggcagat aacatcgacc caacatcctc 6480 
gagccatact acagcataaa aggatacgtt ttctttaaca gaaatttacc cttttgttat 6540 
cagcacatac aaaaaaaaag aaatttaaga tgagtaggac ttccattctc tcaaaaattt 6600 
tattcaatcc ataaatgaat tatttttgga caaaaaagaa agattatgcc tgattttctc 6660 
tatttttttt ttttttacaa ctccaccaafc actttctagc ccagcttggc gtaatcatgg 6720 
tcatagctgt ttcctgtgtg aaattgttat ccgctcacaa ttccacacaa catacgagcc 6780 
ggaagcataa agtgtaaagc etggggfcgtM fcaatgagtga gctaactcac attaattgcg '6840 
ttgcgctcac tgcccgcttt ccagtcggga aacctgtcgt gccagctgca ttaatgaatc 6900 
ggccaacgcg cggggagagg cggtttgcgt attgggccaa agacaaaagg gcgacattca 6960 
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accgattgag ggagggaagg taaatattga cggaaattat tcattaaagg tgaattatca 7020 

ccgtcaccga cttgagccat ttgggaatta gagccagcaa aatcaccagt agcaccatta 7080 

ccattagcaa ggccggaaac gtcaccaatg aaaccatcga tagcagcacc gtaatcagta 7140 

gcgacagaat caagtttgcc tttagcgtca gactgtagcg cgttttcatc ggcattttcg 7200 

gtcatagccc ccttattagc gtttgccatc ttttcataat caaaatcacc ggaaccagag 7260 

ccaccaccgg aaccgcctcc ctcagagccg ccaccctcag aaccgccacc ctcagagcoa 7320 

ccaccctcag agccgccacu agaaccacca ccagagocgo cgcoagcatt gaoaggaggc 73 80 

ccgatctagt aacatagatg acaccgcgcg cgataattta tcctagtttg cgcgctatat 7440 
tttgttttct atcgcgtatt aaatgtataa ttgcgggact ctaatcataa aaacccatct 
cataaataac gtcatgcatt acahgttaat tattacatgc ttaacgtaat tcaacagaaa 

ttatatgata atcatcgcaa gaccggcaac aggattcaat cttaagaaac tttattgcca 7620 

aafcgtttgaa cgatcgggga tcatccgggt ctgtggcggg aactccacga aaatatccga 7680 

acgcagcaag atatcgcggt gcatctcggt cttgcctggg cagtcgccgc cgacgccgtt 7740 

gatgtggacg ccgggcccga tcatattgtc gctcaggatc gtgyegttgt gcttgtcggc 7800 
cgttgctgtc gtaatgatat cggcaccttc gaccgcctgt tccgcagaga tcccgtgggc 7860 
gaagaactcc agcatgagat ccccgcgctg gaggatcatc cagccggcgt cccggaaaac 7920 
gattccgaag cccaaccttt catagaaggc ggcggtggaa tcgaaatctc gtgatggcag 
gttgggcgto gcttggtcgg tcatttcgaa ccccagagtc ccgctcagaa gaactcgtca 
agaaggcgat agaaggcgat gcgctgcgaa tcgggagcgg cgataccgta aagcacgagg 8100 
aagcggtcag cccattcgcc gccaagctcfc tcagcaatat cacgggtagc caacgctatg 8160 
tcctgatagc ggtccgccac acccagccgg ccacag.tcga tgaatccaga aaagcggcca 8220 
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ttttccacca tgatattcgg caagcaggca tcgccatggg tcacgacgag atcatcgccg 828 0 
tcgggcatgc gcgccttgag cctggcgaac agttcggctg gcgcgagccc ctgatgctct 
tcgtccagat catcctgatc gacaagaccg gcttccatcc gagtacgtgc tcgctcgatg 

cgatgtttcg cttggtggtc gaatgggcag gtagccggat caagcgtatg cagccgccgc 8460 

attgcatcag ccatgatgga tactttctcg gcaggagcaa ggfcgagatga caggagatcc 8520 

tgccccggca cttcgcccaa tagcagccag tcccttcccg cttcagtgac aacgfccgagc 8580 

acagctgcgc aaggaacgcu cgtcgtggcc agccacgafca gccgcgctgn eteatcetac 8640 

agtbcattca gggcaccgga caggtcggtc ttgacaaaaa gaaccgggcg cccctgcgct 8700 

gacagcggga acacggcggc atcagagcag ccgattgtct gttgtgccca gtcatagcog 8760 

aatagcctct ccacccaagc ggccggagaa cctgcgtgca atccatcttg ttcaatcatg 8820 

cgaaacgatc cagatccggt gcagattatt tggattgaga gtgaatatga gactctaafct 8880 

ggataccgag gggaatttat ggaacgtcag tggagcattt ttgacaagaa atatttgcta 8940 
gctgatagtg accttaggcg acttttgaac gcgcaataat ggtttctgac gfcatgtgctt 
agctcattaa actccagaaa CCCgcggctg aytggctccfc tcaacgttgc ggttctgtea 

gttccaaacg taaaacggct tgtcccgcgt catcggcggg ggtcataacg tgactccctt 9120 

aattctccgc tcatgatcag attgtcgttt cccgccttca gtttaaacta .tcagtgtttg 9180 

acaggatata ttggcgggta aacctaagag aaaagagcgt ttattagaat aatcggatat 9240 

ttaaaagggc gtgaaaaggt ttatccgttc gtccatttgt atgtgcatgc caaccacagg 9300 

gttccccaga tctggcgccg gccagcgaga cgagcaagat tggccgccgc ccgaaacgat 9360 

ccgacagcgc gcccagcaca ggtgcgcagg caaattgcac caacgcatac agcgccagca 9420 

gaatgccata gtgggcggtg acgtcgttcg agtgaaccag atcgcg^gg aggcccggca 9480 
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gcaccggcat aatcaggccg atgccgacag cgtcgagcgc gacagtgctc agaattacga 9540 

tcaggggtat gttgggtttc acgtctggcc tccggaccag cctccgctgg tccgattgaa 9600 

cgcgcggatt ctttatcact gataagttgg tggacatatt atgtttatca gtgataaagt 9660 

gtcaagcatg acaaagttgc agccgaatac agtgatccgt gccgccctgg accfcgttgaa 9720 

cgaggtcggc gtagacggtc tgacgacacg caaactggcg gaacggttgg gggttcagca- 9780 

gccggcgctt tactggcact tcaggaacaa gcgggcgctg ctcgacgcac tggccgaagc 9840 

catgctggcg gagaatcata cgcattcggt gccgagagoo gaogaogaot ggcgctcatt 9900 

tctgafccggg aatgcccgca gcttcaggca ggcgctgctc gcctaccgcg atggcgcgcg 9960 

catccatgcc ggcacgcgac cgggcgcacc gcagatggaa acggccgacg cgcagcttcg 10020 

cttcctctgc gaggcgggtt tttcggccgg ggacgccgtc aatgcgctga tgacaatcag 100 80 

ctacttcact gttggggccg tgcttgagga gcaggocggc gacagcgatg ccggcgagcg 10140 

cggcggcacc gttgaacagg ctccgctctc gccgctgttg cgggccgcga tagacgcctt 10200 

cgacgaagcc ggtccggacg cagcgttcga gcagggactc gcggtgattg tcgatggatt 10260 

ggcgaaaagg aggctcgttg tcaggaacgt tyaaygaccg agaaagggtg acgattgatc 10320 

aggaccgctg ccggagcgca acccactcac tacagcagag ccatgtagac aacatccccfc 10380 

ccccctttcc accgcgtcag acgcccgtag cagcccgcta cgggcttttt catgccctgc 10440 

cctagcgtcc aagcctcacg gccgcgctcg gcctctctgg cggccfctctg gcgctcttcc 10500 

gcttcctcgc tcactgactc gctgcgctcg gtcgttcggc tgcggcgagc ggtatcagct 10560 

cactcaaagg cggtaatacg gttatccaca gaatcagggg ataacgcagg aaagaacatg 10620 

tgagcaaaag gccagcaaaa ggccaggaac cgtaaaaagg ccgcgttgct ggcgtttttc 10680 

cataggctcc gcccccctga cgagcatcac aaaaatcgac gcccaagtca gaggtggcga 10740 
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aacccgacag gactataaag ataccaggcg tttccccctg gaagctccct cgtgcgctct 10800 

cctgttccga ccctgccgcfc taccggatac ctgtccgcct ttctcccttc gggaagegtg 10860 

gcgcttttcc gctgcataac cctgcttcgg ggtcattata gcgatttttt cggtatatcc 10920 

atcctttttc gcacgatata caggattttg ccaaagggtt cgtgtagact ttccttggtg 10980 

tatccaacgg cgtcagccgg gcaggatagg tgaagtaggc ccacccgcga gcgggtgttc 11040 

cttcttcact gtcccttatt cgcacctggc ggtgctcaac gggaatcctg ctctgcgagg 11100 

Ctggccggct eujoyccggcg taacagatga gggcaagcgg atggctgatg aaaocaagce 11160 

aaccaggaag ggcagcccac ctatcaaggt gtactgcctt ccagacgaac gaagagcgat 11220 

tgaggaaaag gcggcggcgg ccggcatgag cctgtcggcc tacctgctgg ccgtcggcca 11280 

gggctacaaa atcacgggcg tcgtggacta tgagcacgtc cgcgagctgg cccgcatcaa 11340 

tggnga«etg ggccgcctgg crcacrcctgct gaaactctgg ctcaccgacg acccgcgcac 11400 

ggcgcggttc ggtgatgcca cgatcctcgc cctgctggcg aagatcgaag agaagcagga 11460 

cgagcttggc aaggtcatga tgggcgtggt ccgcccgagg gcagagccat gactttttta 11520 

gccgctaaaa cggccggggg gtgcgcgtga ttgccaagca cgtccccatg cgctccatca 11580 

agaagagcga cttcgcggag ctggtgaagt acatcaccga cgagcaaggc aagaccgagc 11640 

gcctttgcga cgctcaccgg gctggttgcc ctcgccgctg ggctggcggc cgtctatggc 11700 

cctgcaaacg cgccagaaac gccgtcgaag ccgtgtgcga gacaccgcgg ccgccggcgt 11760 

tgfcggafcacc togoggaaaa cfctggccchf! setegaeagat gaggggcgga cgttgacact 11820 

tgaggggccg actcacccgg cgcggcgttg acagatgagg ggcaggctcg atttcggacg 11880 

gcgacgtgga gctggccagc ctcgcaaatc ggcgaaaacg cctgatttta cgcgagtttc 11940 
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ccacagatga tgtggacaag ccbggggata agtgccctgc ggtattgaca cttgaggggc 120 00 
gcgactactg acagatgagg ggcgcgatcc ttgacacttg aggggcagag tgctgacaga 12060 
tgaggggcgc acctattgac atttgagggg ctgtccaeag gcagaaaatc oagmtttgc 12120 
aagggtttcc gcccgttttt cggccaccgc taacctgtct fcttaacctgc ttttaaacca 12180 
atatttataa accttgtttt taaccagggc tgcgccctgt gcgcgtgacc gcgcacgccg 12240 
aaggggggtg cccccccttc tcgaaccctc ccggcccgct aacgcgggcc tcccatcccc 
ccaggggctg cgcccctcgg ccgcgaacgg cctcacccca aaaatggcag cgctggcagt 123 
. ccttgccatt gccgggatcg gggcagtaac gggatgggcg atcagcccga gcgcgacgcc 

cggaagcatt gacgtgccgc aggtgctggc atcgacattc agcgaccagg tgccgggcag 12480 
tgagggcggc ggcctgggtg gcggcctgcc cttcacttcg gccgtcgggg cattcacgga 12 
cttcatggcg gggccggcaa tttttacctt gggcattctt ggcatagtgg fccgcgggtgc 
egtffeteoto fcfecaasaatg caataaaccc agcgaaccat ttgaggtgat aggtaagatt 12660 
ataccgaggt atgaaaacga gaattggacc tttacagaat tactctatga agcgccatat 12720 
ttaaaaagct accaagacga agaggatgaa gaggatgagg aggcagattg ccttgaatat 12780 
afctgacaata ctgataagat aatafcatctt ttatatagaa gatatcgccg tatgtaagga 
tttcaggggg caaggcatag gcagcgcgct tatcaatata tctatagaat gggcaaagca 
taaaaacttg catggactaa tgcttgaaac ccaggacaat aaccttatag cttgtaaatt 
ctatcataat tgggtaatga ctccaactta ttgatagtgt tttatgttca gafcaatgccc 13020 
gatgactttg tcatgcagct coaceo&tbt tcragaacgac agcgacttcc gtcccagccg 13080 
tgccaggtgc tgcctcagat tcaggttatg ccgctcaatt cgctgcgtat atcgcttgct 13140 
gattacgtgc agctttccct tcaggcggga ttcatacagc ggccagccat ccgtcatcca 13200 



12300 



12420 



12600 



12840 
12900 
12960 
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tatcaccacg tcaaagggtg acagcaggct cataagacgc cccagcgtog ccatagtgcg 13260 
ttcaccgaat acgtgcgcaa caaccgtctt ccggagactg tcatacgcgt aaaacagcca 13320 
gcgctggcgc gatttagccc cgacatagcc ccactgttcg tccattfcccg cgcagacgat 13380 
gacgtcactg cccggctgta tgcgcgaggt taccgactgc ggcctgagtt ttttaagtga 13440 
cgtasMtco tgttaaagcc aacacccafca atgcgggctg ttgcccggca tccaacgcca 13500 
ttcatggcca tatcaatgat tttctggtgc gtaccgggtt gagaagcggt gtaagtgaac 13560 
tgcagttgcc atgttttacg gcagtgagag cagagatagc gctgatgtcc ggcggtgctt 13620 
ttgccgttac gcaccacccc gtcagtagct gaacaggagg gacagctgat agacacagaa 13680 
gccactggag cacctcaaaa acaccatcat acactaaatc agtaagttgg cagcatcacc 
cataattgtg gtttcaaaat cggctccgtc gatactatgt tatacgccaa cfcttgaaaac 
aactttgaaa aagctgtttt ctggtattta aggttttaga atgcaaggaa cagtgaattg 13860 
gagfctcgfcct tgttataatt agcfctcthgcf gcrtatcttta aatactatag aaaagaggaa 13920 
ggaaataata aatggctaaa atgagaatat caccggaatt gaaaaaactg atcgaaaaat 13980 
accgctgcgt aaaagatacg gaaggaatgt ctcctgctaa ggtatataag ctggtgggag 14040 
aaaatgaaaa cctatattta aaaatgacgg acagccggta taaagggacc acctatgatg 14100 
tggaacggga aaaggacatg atgctatggc tggaaggaaa gctgcctgtt ccaaaggfccc 14160 
tgcactttga acggcafcgat ggctggagca atctgctcat gagtgaggcc gatggcgtcc 14220 
tttgctcgga agagtatgaa gatgaacaaa gccctgaaaa gattatcgag ctgtatgcgg 14280 
agtgcatcag gctctttcac tccatcgraoa tatcggattg teeetataog aafc&gettag 14340 
acagccgctt agccgaattg gattacttac tgaataacga tctggccgat gfcggattgcg 14400 
aaaactggga agaagacact ccatttaaag afcccgcgcga gctgtatgat tttttaaaga 14460 



13740 
13800 
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cggaaaagcc cgaagaggaa cttgtctttt cccacggcga cctgggagac agcaacatct 14520 
ttgfcgaaaga tggcaaagta agtggcttta ttgatcttgg gagaagcggc agggcggaca 14580 
agtggtatga cattgccttc tgcgtccggt cgatcaggga ggatatcggg gaagaacagt 14640 
atgtcgagct attttttgac ttactgggga tcaagcctga ttgggagaaa ataaaatatt 
atattttacfc ggahpaattcr ttttacrtacc tacratgtggc gcaacgatgc cggcgacaag 
caggagcgca ccgacttcfct ccgcatcaag tgttttggct ctcaggocga ggcccacggc 14820 
aagtatttgg gcaaggggtc gctggtattc gtgcagggca agattcggaa taccaagtac 148 SO 
gagaaggacg gccagacggt ctacgggacc gacttcattg ccgataaggt ggabtatctg 14940 
gacaccaagg caccaggcgg gtcaaatcag gaataagggc acattgcccc ggcgtgagtc 



14700 
14760 



15000 



15060 
15120 
15180 
15240 



ggggcaatcc cgcaaggagg gtgaatgaat cggacgtttg accggaaggc atacaggcaa 
gaactgatcg acgcggggfct ttccgocgag gatgacgaaa ccatcgcaag ccgcaccgtc 
atgcgtgcgc cccgcgaaac cttccagtcc gtcggctcga tggtccagca agctacggcc 
aagatcgagc gcgacagcgt gcaactggct ccccctgccc tgcccgcgcc atcggccgcc 

gtggagcgtt cgcgtcgtct cgaacaggag gcggcaggtt tggcgaagtc gatgaccatc 15300 

gacacgcgag gaactatgac gaccaagaag cgaaaaaccg ccggcgagga cctggcaaaa 15360 

caggtcagcg aggccaagca ggccgcgttg ctgaaacaca cgaagcagca gatcaaggaa 15420 

atgcagcttt ccttgttcga tattgcgccg tggccggaca cgatgcgagc gatgccaaac 15480 

gacacggccc gctctgccct gttcaccacg cgcaacaaga aaatcccgcg ogaggcgctg 15540 

caaaacaagg tcattttcca cgtcaacaag gacgtgaaga tcacctacac cggcgtcgag 15600 

ctgcgggccg acgatgacga actggtgtgg cagcaggtgt tggagtacgc gaagcgcacc 15660 

cctatcggcg agccgatcac cttcacgttc tacgagcttt gccaggacct gggctggtcg 15720 
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atcaatggcc ggtattacac gaaggccgag gaatgcctgt cgcgcctaca ggcgacggcg 15780 

atgggcttca cgtccgaccg cgttgggcac ctggaatcgg tgtcgctgct gcaccgctto 15840 

cgcgtcctgg accgtggcaa gaaaacgtcc cgttgccagg tcctgatcga cgaggaaatc 15900 

gtcgtgcfcgt ttgctggcga ccactacacg aaattcatat gggagaagta ccgcaagctg 15960 

tcgccgacgg cccgacggat gttcgactat ttcagctcgc accgggagcc gtacccgctc 16020. 

aagctggaaa ccttccgcct catgtgcgga tcggattcca cccgcgtgaa gaagtggcgc 15080 

gagcaggtcg gcgaagccty cgaagegfctg ccr&ggcagcg gcctggtgga aoacgoctgg 16140 

gtcaatgatg acctggtgca ttgcaaacgc tagggccttg tggggtcagt tccggctggg 16200 

ggttcagcag ccagcgcttt actggcattt caggaacaag cgggcactgc tcgacgcact 16260 

tgcttcgctc agtatcgctc gggacgcacg gcgcgctcta cgaactgccg ataaacagag 16320 

gattaaaatt gacaattgtg attaaggctc agattcgacg gcttggagcg gccgacgfcgc 16380 

aggatttccg cgagatccga ttgtcggccc tgaagaaagc tccagagatg ttcgggtccg 16440 

tttacgagca cgaggagaaa aagcccatgg aggcgttcgc tgaacggttg cgagatgccg 16500 

tggcattcgg cgcctacatc gacggcgaga tcattgggct gLcggtcttc aancaggagg 1G5S0 

acggccccaa ggacgctcac aaggcgcatc tgtccggcgt tttcgtggag cccgaacagc 16620 

gaggccgagg ggtcgccggt atgctgctgc gggcgttgcc ggcgggttta ttgctcgtga 16680 

tgatcgtccg acagattcca acgggaatct ggtggatgcg catcttcatc ctcggcgcac 16740 

- ttaatatttc gctattctgg agcttgttgt ttatttcggt ctaccgcctg ccgggcgggg 16800 

tcgcggcgac ggtaggcgct gtgcagcegc tgatggtcgt gttcatctct gccgctctgc 16860 
taggtagccc gatacgattg atggcggtcc tgggggctat ttgcggaact gcgggcgtgg 16920 
cgctgttggt gttgacacca aacgcagcgc tagatcctgt cggcgtcgca gcgggcctgg 16980 
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cgggggcggt ttccatggcg ttcggaaccg tgctgacccg caagtggcaa cctcccgtgc 17040 

ctctgctcac ctttaccgcc tggcaactgg cggccggagg acttctgctc gttccagtag 17100 

ctttagtgtt tgafcccgcca atcccgatgc ctacaggaac caafcgttefcc ggcctggcgt 17160 

ggctcggcct gatcggagcg ggtttaacct acttcctttg gttccggggg atctcgcgac 17220 

tcgaacctac agttgtttcc ttactgggct ttctcagccc cagatetggg gtcgatcagc 17280 

cggggatgca tcaggccgac agtcggaact tcgggtcccc gacctgtacc attcggtgag 17340 

caaLgytttag gggagttgat atcgtcoacg ttcacttcta aagaaatagc gaaactcagc 17400 

ttcctcagcg gctttatcca gcgattfccct attatgtcgg catagttctc aagatcgaca 17460 

gcctgtcacg gttaagcgag aaatgaataa gaaggctgat aattcggatc tctgcgaggg 17520 

agatgatatt tgatcacagg cagcaacgct ctgtcatcgt tacaatcaac afcgctaccct 17580 

ccgcgagatc atccgtgttt caaacccggc agcttagttg ccgttcttcc gaatagcatc 17640 

ggtaacatga gcaaagtctg ccgccttaca acggctctcc cgctgacgcc gtcccggact 17700 

gatgggctgc ctgtatcgag tggtgatttt gtgccgagct gccggtcggg gagctgttgg 17760 

ctggctggtg gcaggatata ttgtggtgta aacaaattga cycLtagaua acttaataac 17020 

acattgcgga cgtttttaat gtactggggt ggtttttctt ttcaccagtg agacgggcaa 17880 

cagctgattg cccttcaccg cctggccctg agagagttgc agcaagcggt ccacgctggt 17940 

ttgccccagc aggcgaaaat cctgtttgat ggtggttccg aaatcggcaa aatcccttat 18000 

aaatcaaaag aatagcccga gatagggttg agfcgttgttc cagtttggaa caagagtcca 18060 

ctattaaaga acgtggactc caacgtcaaa gggcgaaaaa ccgtctatca gggcgatggc 1812 0 

ccactacgtg aaccatcacc caaatcaagt tttttggggt cgaggfcgccg taaagcacfca 18180 

aatcggaacc ctaaagggag cccccgattt agagcttgac ggggaaagcc ggcgaacgtg 18240 
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2917358 
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gcgagaaagg aagggaagaa agcgaaagga gcgggcgcca ttcaggctgc gcaacfcgttg 18300 

ggaagggcga tcggtgcggg cctcttcgct attacgccag ctggcgaaag ggggatgtgc 18360 

tgcaaggcga ttaagfctggg taacgccagg gttttcccag tcacgacgtt gtaaaacgac 18420 

ggccagtgaa ttcgagctcg gtacccggg 18449 



<21G> 50 

<211> 18617 

<212> TM& 

<213> Artificial 

<220> 

<223> Plasmid 



<220> 

<221> misc_feature 

<222> [10264) .. (10264) 

<223> n is a, c, g, or t 

<220> 

<221> misc_feature 

<222> (10472) (10472) 

<223> n is a, c, g, or t 

<220> 

<221> misc_feature 

<222> (10563) .. (10563) 

<223> n is a, c, g, or t 

<400> 50 

ccgggcfcggt tgccctcgcc gctgggcfcgg cggccgtcta tggccctgca aacgcgccag 60 

aaacgccgtc gaagccgtgt gcgagacacc gcggccgccg gcgttgtgga tacctcgcgg 120 

aaaacttggc cctcactgac agatgagggg cggacgttga cacttgaggg gccgactcac 180 



ccggcgcggc gttgacagat gaggggcagg ctcgatttcg gccggcgacg tggagctggc 240 
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cagcctcgca aatcggcgaa aacgcctgat tttacgcgag tttcccacag atgatgtgga 300 

caagcctggg gataagtgcc ctgcggtatt gacacttgag gggcgcgact actgacagat 360 

gaggggcgcg atccttgaca cttgaggggc agagtgctga cagatgaggg gcgcacctat 420 

tgacatttga ggggctgtcc acaggcagaa aatccagcat ttgcaagggt ttccgcccgt 480 

ttttcggcca ccgctaacct gtcttttaac ctgcttttaa aacaatattt ataaaccttg 540 

tttttaacca gggctgcgcc ctgtgcgcgt gaccgcgcac gccgaagggg ggtgcccccc 600 

ot-Lotcgaac cctcccggcc cgotaaogag ggootcccat cecaccBcsaa gntgcgcccc 660 

tcggccgcga acggcctcac cccaaaaatg gcagcgctgg cagtccttgc cattgccggg 72 0 

atcggggcag taacgggatg ggcgatcagc ccgagcgcga cgcccggaag cattgacgtg 780 

ccgcaggtgc tggcatcgac attcagcgac caggtgccgg gcagtgaggg cggcggcctg 840 
ggtggcggcc tgcccttcac ttcggccgtc ggggcattca cggacttcat ggcggggccg 900 
gcaattttta ccttgggcat tcttggcata gtggtcgcgg gtgccgtgct cgtgttcggg 960 

ggtgcgataa acccagcgaa ccatttgagg tgataggtaa gattafcaccg aggtatgaaa 1020 

acgagaattg gaCCtttaca gaattactct atgoagcgcc atatttaaaa agctaooaag 1080 

acgaagagga tgaagaggat gaggaggcag attgccttga atatattgac aatactgata 1140 

agataatata tcttttafcat agaagatatc gccgtatgta aggatttcag ggggcaaggc 1200 

ataggcagcg cgcttatcaa tatatcfcata gaatgggcaa agcataaaaa cttgcatgga 1260 

ctaatgcttg aaacccagga caataacctt atagcttgta aattctatca taattgggta 1320 

atgactccaa cttattgata gtgttttatg ttcagataat gcccgatgac tttgtcatgc 1380 

agctccaccg attttgagaa cgacagcgac ttccgtccca gccgtgccag gtgctgcctc 1440 

agattcaggt tatgccgctc aafctcgctgc gtatatcgct tgctgaULac gtcrcagcttfc 1500 
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cccttcaggc gggattcata cagcggccag ccatccgtca tccatatcac cacgtcaaag 1560 

ggtgacagca ggctcataag acgccccagc gtcgccatag tgcgttcacc gaatacgtgc 1620 

gcaacaaccg tcttccggag actgtcatac gcgtaaaaca gccagcgctg gcgcgattta 1680 

gccccgacat agccccactg tfccgtccatt tccgcgcaga cgatgacgtc actgcccggc 1740 

tgtatgcgcg aggttaccga ctgcggcctg agttttttaa gtgacgtaaa atcgtgt.tga 1800 

ggccaacgcc cataatgcgg gctgttgccc ggcatccaac gccattcafcg gccatatcaa 1860 

tgattttctg gtgcgtaccg ggttyagciag cygtgtaagt gaactgcagt tgccelfegtfet 1920 

tacggcagtg agagcagaga tagcgctgat gtccggcggt gcttttgccg ttacgcacca 1980 

• ccccgtcagt agctgaacag gagggacagc tgatagacac agaagccact ggagcacctc 2040 

aaaaacacca tcatacacta aatcagtaag ttggcagcat cacccataat tgtggtttca 2100 

aaatcggctc cgtcgafcact atgttatacg ccaactttga aaacaacttt gaaaaagctg 2160 

ttttctggta tttaaggttt tagaatgcaa ggaacagtga attggagttc gtcttgttat 2220 

aattagcttc ttggggtatc tttaaatact gtagaaaaga ggaaggaaat aataaatggc 2280 

taaaatgaga atatcaccgg aattgaaaaa actgatcgaa aaataccgct gcyt.aaa.agei 2340 

tacggaagga atgtctcctg ctaaggtata taagctggtg ggagaaaafcg aaaacctata 2400 

tttaaaaatg acggacagcc ggtataaagg gaccacctat gatgtggaac gggaaaagga 2460 

catgatgcta tggctggaag gaaagctgcc tgttccaaag gtcctgcact ttgaacggca 2520 

tgatggctgg agcaatctgc tcatgagtga ggccgatggc gtcctttgct cggaagagta 2580 

tgaagatgaa caaagccctg aaaagattat cgagctgtat gcggagtgca tcaggctctt 2640 

tcactccatc gacatatcgg attgtcccta tacgaatagc ttagacagcc gcttagccga 2700 

attggattac ttactgaata acgatctggc cgatgtggat tgcgaaaact gggaagaaga 2760 
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cactccattt aaagafcccgc gcgagctgta tgatttttta aagacggaaa agcccgaaga 2820 

ggaacttgtc tfcttcccacg gcgacctggg agacagcaac atctttgtga aagatggcaa 2880 

agtaagtggc tttattgatc ttgggagaag cggcagggcg gacaagtggt atgacafctgc 2940 

cttctgcgtc cggtcgatca gggaggatat cggggaagaa cagtatgtcg agctattttt 3000 

tgacttactg gggatcaagc ctgattggga gaaaataaaa tattatattt tactggatga 3060 

attgttttag tacctagatg tggcgcaacg atgccggcga caagcaggag cgcaccgact 3120 

tcttccgcat caagtgtttt ggctctcagg ccgaggccca cggcaagtat ttgggcaagg 3180 

ggtcgctggt attcgtgcag ggcaagattc ggaataccaa gtacgagaag gacggccaga 3240 

cggfcctacgg gaccgacttc attgccgata aggtggatta tctggacacc aaggcaccag 3300 

gcgggtcaaa tcaggaataa gggcacattg ccccggcgtg agtcggggca atcccgcaag 33 60 

gagggtgaat- gaatcggacg tttgaccgga aggcatacag gcaagaactg atcgacgcgg 3420 

ggttttccgc cgaggatgcc gaaaccatcg caagccgcac cgtcatgcgt gcgccccgcg 3480 
aaaccttcca gtccgtcggc tcgatggtcc agcaagctac ggccaagatc gagcgcgaca 3540 
gcgtgcaact ggctccccct gccctgcccg cgcc'atcggc cgccgtggag cgttcgcgtc 3600 
gtctcgaaca ggaggcggca ggtttggcga agtcgatgac catcgacacg cgaggaacta 3660 
tgacgaccaa gaagcgaaaa accgccggcg aggacctggc aaaacaggtc agcgaggcca 3720 
agcaggccgc gttgctgaaa cacacgaagc agcagatcaa ggaaatgcag ctttccttgt 3780 
tcgatafctgc gccgtggcag gacacgatge gagcgatgcc aaacgacacg gcccgctctg 3840 
ccctgttcac cacgcgcaac aagaaaatcc cgcgcgaggc gctgcaaaac aaggtcattt 3900 
tccacgtcaa caaggacgtg aagatcacct acaccggcgfc cgagctgcgg gccgacgatg 3960 
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acgaactggt gtggcagcag gtgttggagt acgcgaagcg cacccctatc ggcgagccga 4020 

tcaccttcac gttctacgag ctttgccagg acctgggctg gtcgatcaat ggccggtatt 4080 

acacgaaggc cgaggaatgc ctgtcgcgcc tacaggcgac ggcgatgggc ttcacgtccg 4140 

accgcgttgg gcacctggaa tcggtgtcgc tgctgcaccg cttccgcgtc ctggaccgtg 42 00 

gcaaga^ac crtccccrttgc cacrcrtcctga tcgacgagga aatcgtcgtg ctgttfcgetg 4260 

gcgaccacta cacgaaabtc atatgggaga agtaccgcaa gctgtcgccg acggcccgac 4320 

ggatgttcga ctatttcagc tcgcaccggg agccgtaccc gctcaagctg gaaaccttcc 4380 

gcctcatgtg cggatcggat tccacccgcg tgaagaagfcg gcgcgagcag gtcggcgaag 4440 

cctgcgaaga gttgcgaggc agcggcctgg tggaacacgc ctgggtcaat gatgacctgg 4500 

tgcattgcaa acgctagggc cttgtggggt cagttccggc tgggggfctca gcagccagcg 4560 

ctttactggc atttcaggaa caagcgggca ctgctcgacg cacttgcttc gctcagtafcc 4620 

gctcgggacg . cacggogogo tctaccraant gecaataaac agaacrattaa aattgacaat 4680 

tgtgattaag gctcagattc gacggcttgg agcggccgac gtgcaggatt tccgcgagat 4740 

ccgattgtcg gccctgaaga aagctccaga gatgttcggg tccgtttacg agcacgagga 4800 

gaaaaagccc atggaggcgt tcgctgaacg gttgcgagat gccgtggcat tcggcgccta 4860 

catcgacggc gagatcattg ggctgtcggt cttcaaacag gaggacggcc ccaaggacgc 4920 

tcacaaggcg catctgtccg gcgttttcgt ggagcccgaa cagcgaggcc gaggggtcgc 4980 

cggtatgctg ctgcgggcgt tgccggcggg tttattgctc gtgatgafccg tccgacagat 5040 

tccaacggga atctggtgga tgcgcatctfc catcotcggc geaefcfcaata fctfccgctatt 5100 

ctggagcttg ttgtttattt cggtctaccg cctgccgggc ggggtcgcgg cgacggtagg 5160 

cgctgtgcag ccgctgatgg tcgtgttcat ctctgccgct ctgctaggta gcccgatacg 5220 
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attgatggcg gtcctggggg ctatttgcgg aactgcgggc gtggcgctgt tggtgfctgac 5280 

accaaacgca gcgctagatc ctgtcggcgt cgcagcgggc ctggcggggg cggtttccat 5340 

ggcgttcgga accgtgctga cccgcaagtg gcaacctccc gtgcctctgc tcacctttac 5400 

cgcctggcaa ctggcggccg gaggacttct gctcgttcca gtagctttag tgtttgatcc 5460 

a «i»ateccff atgcctacacj gaaccaatgt tctcggcctg gcgtggctcg gcctgatcgg 5520 

agcgggttta acctacttcc tttggttccg ggggatctcg cgactcgaac cfcacagttgt 5580 

ttccttactg ggctttctca gccccagatc tggggtcgat cagccgggga tgcatcaggc 5640 

cgacagtcgg aacttcgggt ccccgacctg taccattcgg tgagcaafcgg ataggggagt 5700 

tgatatcgtc aacgttcact tctaaagaaa tagcgccact cagcttcctc agcggcttta 5760 
tccagcgatt tcctattatg tcggcatagt tctcaagatc gacagcctgt cacggttaag 5820 
cgagaaatga ataagaaggo tgataattcg gatctctgcg agggagatga tatttgatca 5880 
caggoagcaa ocfatctgtca tegfctacaat caacatacta ccctccgcga gatcatccgt 5940 
gtttcaaacc cggcagctta gttgccgttc ttccgaatag catcggtaac atgagcaaag 6000 
tctgccgcct tacaacggct ctcccgctga cgccgtcccg gactgatggg ctgcctgtat 6060 
cgagtggtga ttttgtgccg agctgccggt cggggagctg ttggctggct ggtggcagga 6120 
tatattgtgg tgtaaacaaa ttgacgctta gacaacttaa taacacattg cggacgtttt 6180 
taatgtactg gggtggtttt tcttttcacc agtgagacgg gcaacagctg attgcccttc 6240 
accgcctggc cctgagagag ttgcagcaag eggtccacgc tggtttgccc cagcaggcga 6300 
aaatcctgtt tgatggfcggt toogaaatog geaaaatcce fcfcataaataa aaacraatagc 6360 
ccgagatagg gttgagtgtt gttccagttt ggaacaagag tccactatta aagaacgtgg 6420 
actccaacgt caaagggcga aaaaccgtct atcagggcga tggcccacta cgtgaaccat 6480 
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cacccaaatc aagttttttg gggtcgaggt gccgtaaagc actaaatcgg aaccctaaag 6540 

ggagcccccg atttagagct tgacggggaa agccggcgaa cgtggcgaga aaggaaggga 6600 

agaaagcgaa aggagcgggc gccattcagg ctgcgcaact gttgggaagg gcgatcggt 9 6660 

cgggcctctt cgctattacg ccagctggcg aaagggggafc gtgctgcaag gcgattaagfc 6720 

tgastaacgc cagggttttc ccagtcacga cgttgtaaaa cgacggccag tgaattcgag 6780 

ctcggtaccc ggggatcttt cgacactgaa atacgtcgag cctgctccgc ttggaagcgg 6840 

cgaggagcct cgtcctgtca caactaccaa catggagtac gataagggcc agttccgcca 6900 

gctcattaag agccagttca tgggcgttgg catgatggcc gtcatgcafcc tgtacttcaa 6960 

gtacaccaac gctcbtctga tccagtcgat catccgctga aggcgctttc gaatctggtt 7020 

aagatccacg tcttcgggaa gccagcgact ggtgacctcc agcgtccctt taaggctgcc 7080 



aacagcttfcc tcagccaggg ccagcccaag accgacaagg 



cctccctcca gaacgccgag 7140 



aagaactgga ggggtggtgt caaggaggag taagctcctt atfcgaagtcg gaggacggag 7200 

cggtgtcaag aggatattct tcgactctgt attatagata agatgatgag gaattggagg 7260 

tagcatagct tcatttggat ttgcttxcca ggctgagact ctagcfctgga gcatagaggg 7320 

tcctttggct ttcaatattc tcaagtatct cgagtttgaa cttattcect gtgaaccttt 7380 

tattcaccaa tgagcattgg aatgaacatg aatctgagga ctgcaatcgc catgaggttt 7440 

tcgaaataca tccggatgtc gaaggcttgg ggcacctgcg ttggttgaat fctagaacgtg 7500 

gcactattga tcatccgata gctctgcaaa gggcgfctgca caatgcaagt caaacgttgc 7560 

tagcagttcc aggtggaatg ttatgatgag cattgtatfca aatcaggaga tatagcatga 7620 

tctctagtta gctcaccaca aaagtcagac ggcgtaacca aaagtcacac aacacaagct 7680 

gtaaggattt cggcacggct acggaagacg gagaagccac cttcagtgga ctcgaytacc 7740 
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atttaattct atttgtgttt gatcgagacc taatacagoc cctacaacga ccatcaaagt 7800 

cgfcatagcta ccagfcgagga agtggactca aatcgacttc agcaacafcct cctggataaa 7860 

ctttaagcct aaactataca gaataagata ggtggagagc ttataccgag ctcccaaatc 7920 

tgtccagatc atggttgacc ggtgcctgga tcttcctata gaatcatcct fcatbcgttga 798 0 

cctagctgat tctggagtga cccagagggt catgacttga gcctaaaafcc cgccgcctcc 8040 

accatttgta gaaaaatgtg acgaactcgt gagctctgta cagtgaccgg tgactctttc 8100 

tggesiLycgg agagncggac ggacgcagag sgaagggafcg agtaataago cactggccag 81 60 

acagctctgg cggctctgag gtgcagtgga tgattatfcaa tccgggaccg gccgcccctc 8220 

cgccccgaag tggaaaggct ggtgtgcccc tcgttgacca agaatctatt gcatcatcgg 8280 

agaatatgga gcttcatcga atcaccggca gtaagcgaag gagaatgtga agccaggggt 8340 

gtatagccgt cggcgaaata gcatgccatt aacctaggta cagaagtcca attgcttccg 8400 

atctggtaaa agattcacga gatagtacct tctccgaagt aggtagagcg agtacccggc 8460 

gcgtaagctc cctaattggc ccatccggca tctgtagggc gtccaaatat cgtgcctctc 8520 

Ctgctttgcc cggtgtatga aaccggaaag ycugctcagg agctggccag cggcgcagac 8580 

cgggaacaca agctggcagt cgacccatcc ggtgctctgc actcgacctg ctgaggfcccc 8640 

tcagtccctg gtaggcagct ttgccccgtc tgtccgcccg gtgtgtcggc ggggttgaca 8700 

aggtcgttgc gtcagtccaa catttgttgc catattttcc tgctctcccc accagctgct 8760 

cttttctttt ctctttcttt tcccatcttc agfcatattca tcttcccatc caagaacctt 8820 

tatttcccct aagtaagtac tttgctacat ccata.ctcca tccttcccat cccttattcc 8880 
tttgaacctt tcagttcgag ctttcccact tcatcgcagc ttgactaaca gcfcaccccgc 8940 
ttgagcagac atcaccatgc ctgaactcac cgcgacgtcc gtcgagaagt ttctgatcga 9 000 
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aaagfctcgac agcgtctccg acctgatgca gctctcggag ggcgaagaat ctcgtgcttt 9060 

cagcttcgat gtaggagggc gtggatatgt cctgcgggta aatagctgcg ccgatggttt 9120 

ctacaaagat cgttatgttt atcggcactt tgcatcggcc gcgctcccga ttccggaagt 9180 

gcttgacatt ggggaattca gcgagagcct gacctattgc atctcccgcc gtgcacaggg 9240 

tgtcacgttg caagacctgc ctgaaaccga actgcccgct gttctgcagc cggtcgcgga 9300 

ggccatggat gcgatcgctg cggccgatct tagccagacg agcgggttcg gcccattcgg 93 SO 

accgcaagga atcggtcaat ^ct.Ucatg gcgtgafcttc atatgogoga fctgotgafeee 9420 

ccabgtgtat cactggcaaa ctgtgatgga cgacaccgtc agtgcgtccg tcgcgcaggc 9480 

tctcgatgag ctgatgcttt gggccgagga ctgccccgaa gtccggcacc tcgtgcacgc 9540 

ggatttcggc tccaacaatg tcctgacgga caatggccgc ataacagcgg tcattgactg 9600 

gagcgaggcg atgttcgggg attcccaata cgaggtcgcc aacatcttct tctggaggcc 9660 

gtggttggct tgtatggagc agcagacgcg ctacttcgag cggaggcatc cggagcttgc 972 0 

aggatcgccg cggctccggg cgtatatgct ccgcattggt cttgaccaac tctatcagag 9780 

cttggttgac ggcaatttcg atgatgcagc ttgggcgcag ggtcg&tgcg aogcaatcgt 9840 

ccgatccgga gccgggactg tcgggcgtac acaaatcgcc cgcagaagcg cggccgtctg 9900 

gaccgatggc tgfcgtagaag tactcgccga tagtggaaac cgacgcccca gcactcgtcc 9960 

gagggcaaag gaatagagta gatgccgacc gcgggatcga tccacttaac gttactgaaa 10020 

tcafccaaaca gcttgacgaa tctggatata agatcgttgg tgtcgatgtc agctccggag 10080 

ttgagacaaa tggtgttcag gatctcgata agatacgttc atttgtccaa gcagcaaaga 10140 

gtgccttcta gtgatttaat agctccatgt caacaagaat aaaacgcgtt ttcgggttta 10200 

cctcttccag atacagctca tctgcaatgc attaatgcat tgactgcaac ctagtaacgy 10260 
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cttncaggct ccggcgaaga gaagaatagc ttagcagagc tattttcatt ttcgggagac 10320 

gagatcaagc agatcaacgg tcgtcaagag acctacgaga ctgaggaatc cgctcttggc 10380 

tccacgcgac tatatatttg tctetaattg tactttgaca tgctcctctt etttactctg 10440 

atagcttgac tatgaaaatt ccgtcaccag cncctgggtt cgcaaagata attgcatgtt 10500 

tcttccttga actctcaagc cfcacaggaca cacattcatc gtaggtataa acctcgaaat 10560 

carxttcctac taagatggta tacaatagta accatgcatg gttgcctagt gaatgctccg 10620 

taacacccaa tacgccggcu gwnefctfcfct taoaaototo ctatgagteg tttsnncaga 10680 

atgcacaggt acacttgttt agaggtaatc cttcttfccta gctagaagtc ctcgtgtact 10740 

gfcgtaagcgc ccactccaca tctccactcg acctgcaggc atgcaagctt gagattaaaa 10800 

tagataagga aaagaaagtg aaaagaaatt cggaagcatg gcacattctt ctttttataa 10 860 

afcaoat gcct gaatfctetfct ttccatcgat atgatatatg catatgatag atatacaago 10920 

aatcttcttc aaggagtttg aaattttgtc ctccaggagc aaaaaaaagt ttttttttat 10980 

• acatgtttgt acacaagaat agttaccaat ttgctttggt cttacgtgct gcaagtttat 11040 . 

atcgttttca atttctttgt ctttacattt tctttgtcct ttatctttcc tcatttagtc 11100 

tttgggagaa ttaggaaaag ggagcggaaa ggtaagaaat gcttgcgtat tttactaatt 11160 

cggcaaacat ccaatttggc aaacagcagc ctgtgcaacg ctctcgagat gacagtatct 11220 

ttgattacac tcfcaaatctc gatgacccga ccaaaaagag cgaacaaaga aataatcttg 11280 

tgc*ttcg«a tatgabggaa gattttttcc eeottattet aaatgttgac atagcgtgta 11340 

tgttatataa acaaaaagaa attgtacaaa etttcttttc ttctcttttt attttatctc 11400 

tatgctgtcg aagctgcagt caatcagcgt caaggcccgc cgcgttgaac tagcccgcga 11460 
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catcacgcgg cccaaagtct gcctgcatgc tcagcggtgc tcgttagttc ggctgcgagt 11520 
ggcagcacca cagacagagg aggcgctggg aaccgtgcag gctgccggcg cgggcgatga 11580 
gcacagcgcc gatgtagcac hccagcagct tgaccgggct atcgcagagc gtcgtgcccg 11540 
gcgcaaacgg gagcagctgt cataccaggc tgccgccatt gcagcatcaa ttggcgtgtc 11700 
aggcattgcc atcttcgcca cctacctgag atttgccatg cacatgaccg tgggcggcgc 11760 
agtgccatgg ggtgaagtgg ctggcacfcct cctcttggtg gttggtggcg cgctcggcat 11820 
ggagatgtat gcccgctatg cacacaaagc catctggcat gagtcgcctc tgggctggct 11880 
gctgcacaag agccaccaca cacctcgcac tggacccttt gaagccaacg acttgtttgc 11940 
aatcatcaat ggactgcccg ccatgctcct gtgtaccttt ggcttctggc tgcccaacgt 12000 
cctgggggcg gcctgctttg gagcggggct gggcatcacg cfcatacggca tggcatatat 12060 
gtttgtacac gatggcctgg tgcacaggcg ctttcccacc gggcccatcg ctggcctgcc 12120 
ctacatgaag r.gcr.fcgacag tggcccacca gctacaccac agcggcaagt acggtggcgc 12180 
gccctggggt atgttcttgg gtccacagga gctgcagcac attccaggtg cggcggagga 12240 
ggtggagcga ctggtcctgg aactggactg gtccaagogg tagaagcttg agattaaaat 12300 
agataaggaa aagaaagtga aaagaaattc ggaagcatgg cacattcttc tttttataaa 12360 
tacatgcctg actttctttt tccatcgata tgatatatgc atatgataga tatacaagca 12420 
atcttcttca aggagtttga aattttgtcc tccaggagca aaaaaaagtt tttttttata 12480 
catgtttgta cacaagaata gttaccaatt tgcttfcggtc ttacgtgctg caagtttata 12540 
tcsrfcfctfccaa tttctttgtc tttacatfctt ctfefcgfceett tatctttcct catttagtct 12 600 
ttgggagaat taggaaaagg gagcggaaag gtaagaaatg cttgcgtatt ttactaatfcc 12660 
ggcaaacatc caatttggca aacagcagcc tgtgcaacgc tctcgagatg acagtatctt 12720 



WO 2004/063358 PCT/EP2004/000100 
302/358 

tgattacact ctaaatctcg atgacccgac caaaaagagc gaacaaagaa ataatcttgt 12780 
gcattcgaat atgatggaag attttttccc ecttattcfca aatgttgaca tagcgtgtat 12840 
gttatataaa caaaaagaaa ttgtacaaac tttcttttct tctcttttta ttttatetct 12900 
atgatccagt tagaacaacc actcagtcat caagcaaaac tgactccagt actgagaagt 12960 
aaatetcagt ttaagggcrct tttcattgct attgtcattg ttagcgcatg ggtcattagc 13020 
ctgagtttat tactttccct tgacatctca aagctaaaat tttggatgfct attgcctgtt 13 080 
atactatggc aaacattttt atatacggga ttatttatta catctcatga tgccatgcat 13140 
ggcgtagtat ttccccaaaa caccaagatt aatcatttga ttggaacatt gaccctatcc 13200 
ctttatggtc ttttaccata tcaaaaacta ttgaaaaaac attggttaca ccaccacaat 13260 
ccagcaagct caatagaccc ggattttcac aatggtaaac accaaagttt ctttgcttgg 13320 
tattttcatt ttatgaaagg ttactggagt tgggggcaaa taattgcgtt gactattatt 13380 
tataaotttg ctaaatacat aefcccatatc ccaagtgata atctaactta cttttgggtg 13440 
ctaccctcgc ttttaagttc attacaatta ttctattttg gtactttttt accccatagt 13500 
gaaccaatag ggggttatgt tcagcctcat tgtgcccaaa caattagccg tcctatttgg 13560 
tggtcattta tcacgtgcta tcattttggc taccacgagg aacatcacga atatcctcat 13620 
atttcttggt ggcagttacc agaaatttac aaagcaaaat agaagcttgg cgtaatcatg 13680 
gtcatagctg tttcctgtgt gaaattgtta tccgctcaca attccacaca acatacgagc 13740 
cggaagcata aagtgtaaag cctggggtgc ctaatgagtg agctaacfcca cattaattgc 13800 
gLtsrcgctca ctgcccgctt taaagtcggg aaaecfeffi-.cg fcgccagctgc attaataaat 13860 
cggccaacgc gcggggagag gcggtttgcg tattgggcca aagacaaaag ggcgacattc 13920 
aaccgattga gggagggaag gtaaatattg acggaaatta ttcattaaag gtgaattato 13980 
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accgtcaccg acttgagcca tttgggaatt agagccagca aaatcaccag tagcaccatt 14040 

accattagca aggccggaaa cgtcaccaat gaaaccatcg atagcagcac cgtaatcagt 14100 

agcgacagaa tcaagtttgc ctttagcgtc agacfcgtagc gcgttttcat cggcattttc 14160 

ggtcatagcc cccttattag cgtttgccafc cttttcataa tcaaaatcac cggaaccaga 14220 

gccaccaccg gaaccgcctc cctcagagcc gccaccctca gaaccgccac cctcagagcc 14280 

accaccctca gagccgccac cagaaccacc accagagccg ccgccagcat tgacaggagg 14340 

cccgafcctag fcaacatagat gacaccgcgc gcgataattt atcctagttt gcgcgctata 14400 

ttttgttttc tatcgcgtat taaatgtata attgcgggac tctaatcata aaaacccatc 14460 

tcataaataa cgtcatgcat tacatgttaa ttattacatg cttaacgtaa btcaacagaa 14520 

attatatgat aatcatcgca agaccggcaa caggattcaa tcttaagaaa ctttattgcc 14580 

aaatgtttga acgatcgggg atcatccggg tctgtggcgg gaactccacg aaaatatccg 14640 

aacgcagcaa gatatcgcgg tgcatctcgg tcttgcctgg gcagtcgccg ccgacgccgt 14700 

tgatgtggac gccgggcccg atcatattgt cgctcaggat cgtggcgttg tgcttgtcgg 14760 

ccgttgctgt cgtaatgata tcggcacctt cgacugwLg LLccgcagag atcccgtggg 14820 

cgaagaactc cagcatgaga tccccgcgct ggaggatcat ccagccggcg tcccggaaaa 14880 

cgattccgaa gcccaacctt tcatagaagg cggcggtgga atcgaaatct cgtgatggca 14940 

ggttgggcgt cgcttggtcg gtcatttcga accccagagt cccgctcaga agaactcgtc 15000 

aagaaggcga tagaaggcga hgcgctgcga atcgggagcg gcgataccgt aaagcacgag 15060 

gaagcggtca gcccattcgc cgccaagctc ttcagcaata tcacgggtag ccaacgctat 15120 

gtcctgatag cggtccgcca cacccagccg gccacagtcg atgaatccag aaaagcggcc 15180 

attttccacc atgatattcg gcaagcaggc atcgccatgg gtcacgacga gatcatcgcc 15240 
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gtcgggcatg cgcgccttga gcct ggC gaa cagttcggcfc ggcgcgagcc cctgatgctc 15300 
ttcgtccaga tcatcctgat cgacaagacc ggcttccatc cgagtacgtg ctcgctcgat 15360 
gcgatgtttc gcttggtggt cgaatgggca ggtagccgga bcaagcgtat gcagccgccg 15420 
cattgcatca gccatgatgg atactttctc ggcaggagca aggtgagatg acaggagatc 15480 
ctgccccggc acttcgccca atagcagcca gtcccttccc gcttcagtga caacgtcgag 15540 
cacagctgcg caaggaacgc ccgtcgtggc cagccacgat agccgcgctg cctcgtcctg 15600 
cagttcattc agyguaccgg acaggtcggt cttgooaaaa agaaocgggc gcooatgcgc 15660 
tgacagccgg aacacggcgg catcagagca gccgattgtc tgttgtgccc agtcatagcc 15720 
gaatagcctc tccacccaag cggccggaga acctgcgtgc aatccatctt gttcaatcat 15780 
gcgaaacgat ccagatccgg tgcagattat ttggattgag agtgaatatg agactctaat 15840 
tggataccga ggggaattta tggaacgtca gtggagcatt tttgacaaga aatatttgct 15900 
agctgatagt gaccttaggc gacttttgaa cgcgcaataa tggtttctga cgtatgtgct 15960 
tagctcatta aactccagaa acccgcggct gagtggctcc ttcaacgttg cggttctgtc 16020 
agttccaaac gtaaaacggc ttgtcccgcg tecitagycgg gggtcataac gtgaqtccct 16080 
'taattctccg ctcatgatca gattgtcgtt tcccgccttc agtttaaact atcagtgttt 16140 
gacaggatat attggcgggt aaacctaaga gaaaagagcg tttattagaa taatcggata 16200 
tttaaaaggg cgtgaaaagg tttatccgtt cgtccatttg tatgtgcatg ccaaccacag 16260 
ggttccccag atctggcgcc ggccagcgag acgagcaaga ttggccgccg cccgaaacga 16320 
tccgacagcg cgcccagcac aggtgcgcag gcaaattgca ccaacgcata cagcgccagc 16380 
agaatgccat agtgggcggt gacgtcgttc gagtgaacca gatcgcgcag gaggcccggc 16440 
agcaccggca taatcaggcc gatgccgaca gcgtcgagcg cgacagtgct cagaattacg 16500 
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atcaggggta tgttgggttt cacgtctggc ctccggacca gcctccgctg gtccgattga 16560 
acgcgcggat tctttatcac tgataagttg gtggacatat tatgtttatc agtgataaag 16620 
tgtcaagcat gacaaagttg cagccgaata cagtgatccg tgccgccctg gacctgttga 16680 
acgaggtcgg cgtagacggt ctgacgacac gcaaactggc ggaacggttg ggggttcagc 16740 
agccggcgct ttactggcac ttcaggaaca agcgggcgct gctcgacgca ctggecgaag 16800 
ccatgctggc ggagaatcat acgcattcgg tgccgagagc cgacgacgac tggcgctcat 16860 
tLctyatcgg ga&tgcccgc agottaaggc aggcgctgct cgonhaccgc gafcaercaccrc 16920 
gcatccatgc cggcacgcga ccgggcgcac cgcagatgga aacggccgac gcgcagcttc 16980 
gcttcctctg cgaggcgggt ttttcggccg gggacgccgt caatgcgctg atgacaatca 17040 
gctacttcac tgttggggcc gtgcttgagg agcaggccgg cgacagcgat gccggcgagc 17100 
gcggcggcac cgttgaacag gctccgctct cgccgctgtt gagggccgcg atagacgcct 17160 
tcgacgaagc cggtccggac gcagcgttcg agcagggact cgcggtgatt gtcgatggat 17220 
tggcgaaaag gaggcfccgtt gtcaggaacg ttgaaggacc gagaaagggt gacgattgafc 17280 
caggaccgct gccggagcgc eiarecactca ctacagoaga gccatgtaga caacatcocc 17340 
tccccctttc caccgcgtca gacgcccgta gcagcccgct acgggctttt tcatgccctg 17400 
ccctagcgtc caagcctcac ggccgcgctc ggcctctctg gcggccttct ggcgctcttc 17460 
cgcttcctcg ctcactgact cgctgcgctc ggtcgttcgg ctgcggcgag cggfcatcagc 17520 
tcactcaaag gcggtaatac ggttatccac agaatcaggg gataacgcag gaaagaacat 17580 
gtgagcaaaa ggccagcaaa aggccaggaa ccgtaaaaag gacgcgttgc tggcgttttt 17640 
ccataggctc cgcccccctg acgagcatca caaaaatcga cgctcaagtc agaggtggcg 17700 
aaacccgaca ggactataaa gataccaggc gtttccccct ggaagctccc tcgfcgcgctc 17760 
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tcctgttccg accctgccgc ttaccggata cctgtccgcc tttctccctt cgggaagcgt 17820 

ggcgcttttc cgctgcataa ccctgcttcg gggtcattat agegattttt tcggtatatc 17880 

catccttttt cgcacgatat acaggatttt gccaaagggt tcgfcgtagac tttccttggt 17940 

gtatccaacg gcgtcagccg ggcaggatag gtgaagtagg cccacccgcg agcgggtgtt 18000 

ccttcttcac tgtcccttat tcgcacctgg cggtgctcaa cgggaatcct gctctgcgag 18060 

gctggccggc taccgccggc 'gtaacagatg agggcaagcg gatggctgat gaaaccaagc 18120 

caaccaggaa gggcagccca ccfcatcaagg hgtacfcgcct tooagaogaa cgaagagcga 18180 

ttgaggaaaa ggcggcggcg gccggcatga gcctgtcggc ctacctgctg gccgtcggcc 18240 

agggctacaa aatcacgggc gtcgtggact atgagcacgt ccgcgagctg gcccgcatca 18300 

atggcgacct gggccgcctg ggcggcctgc tgaaactctg gctcaccgac gacccgcgca 18360 

cggcgcggtt cggtgatgco acgatcctcg ccctgctggc gaagatcgaa gagaagcagg 18420 

acgagcttgg caaggtcatg atgggcgtgg tccgcccgag ggcagagcca tgactttttt 18480 

agccgctaaa acggccgggg ggtgcgcgtg attgccaagc acgtcccoat gcgctccatc 18540 
aagaagagcg acttcgcgga gctggtgaag tacatcaccg acgagcaagg caagaccgag 18600 
cgcctttgcg acgctca 18617 

<210> 51 
<211> 18333 
<212> DHA 
<213> Artificial 

<220> 

<223> Plasmid 
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<22Q> 

<22l> misc_feature 

<222> (10264) .. (10264) 

<223> n is a, c, g, or t 

<220> 

<221> misc_£eature 

<222> (10472) (10472) 

<223> n is a, c, g, or t 

<220> 

<221> misc_feature 

<222> (10563) .. (10563) 

<223s- n is a, c, g, or t 

<400> 51 

ccgggctggt tgccctcgcc gctgggctgg cggccgtcta tggccctgca aacgcgccag 60 

aaacgccgtc gaagccgtgt gcgagacacc gcggccgccg gcgttgtgga tacctcgcgg 120 

aaaacttggc cctcactgac agatgagggg cggacgttga cacttgaggg gccgactcac 180 

ccggcgcggc gttgacagat gaggggcagg ctcgatttcg gccggcgacg tggagctggc 240 

cagcctcgca aatcggcgaa aacgcctgat tttacgcgag tttcccacag atgatgfcgga 300 

caagcctggg gataagtgcc ctgcggtatt gacacttgag gggcgcgact actgacagat 360 

gaggggcgcg atccttgaca cttgaggggc agagtgctga cagatgaggg gcgcacctat 420 

tgacatttga ggggctgtcc acaggcagaa aatccagcat ttgcaagggt ttccgcccgt 4S0 

ttttcggcca ccgctaacct gtcttttaac ctgcttttaa accaatattt ataaaccttg 540 

tttttaacca gggctgcgcc ctgtgcgcgt gaccgcgcac gccgaagggg ggtgcccccc 600 

cttetegaae oefec^pggce egctaacgcg ggectcccat ccccccaggg gctgcgcccc 660 

tcggccgcga acggcctcac cccaaaaatg gcagcgctgg oagtccttgc cattgccggg 720 



atcggggcag taacgggatg ggcgatcagc ccgagcgcga cgcccggaag cattgacgtg 780 
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ccgcaggtgc tggcatcgac attcagcgac 
ggtggcggcc tgcccttcac ttcggccgtc 
gcaattttta ccttgggcat tcttggcata 
ggtgcgataa acccagcgaa ccatttgagg 
acgagaattg gacctttaca gaattactct 
acgaagagga tgaagaggat gaggaggcag 
agataatata tcttttatat agaagatatc 
ataggcagcg cgcttatcaa tatatctata 
ctaatgcttg aaacccagga caataacctt 
atgactccaa cttattgata gtgttttatg 
agcfcccaccg attttgagaa cgacagcgac 
agattcaggt tatgccgctc aattcgctgc 
cccttcaggc gggattcata cagcggccag 
ggtgacagca ggctcataag acgccccagc 
gcaacaaccg tcttccggag actgtcatac 
gccccgacat agccccactg ttcgtccatt 
tgtatgcgcg aggfctaccga ctgcggcctg 
ggccaacgcc cataatgcgg gctgttgccc 
fcgafcfcfchcfcg gfegegfeaecg ggfcfcgagaag 
bacggcagtg agageagaga tagcgctgat 
ccccgtcagt agctgaacag gagggacagc 
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caggtgccgg gcagtgaggg cggcggcctg 840 

ggggcattca cggacttcat ggcggggccg 900 

gtggtcgcgg gtgccgtgct cgtgttcggg 960 

tgataggtaa gattatacog aggtatgaaa 1020 

afcgaagcgcc atatttaaaa agctaccaag 1080 

attgccttga atafcattgac aatactgata 1140 

gccgtatgta aggatttcag ggggcaaggc 1200 

gaatgggcaa agcataaaaa cttgcatgga 1260 

atagcttgta aattctatca taattgggfca 1320 

ttcagafcaafc gcccgatgac fcttgtcatgc 1380 

ttccgtccca gccgtgccag gtgctgcetc 1440 

gtatatcgct tgctgattac gtgcagcttt 1500 

ccatccgtca tccatatcac cacgtcaaag 1560 

gtcgccatag tgcgttcacc gaatacgtgc 1620 

gcgtaaaaca gccagcgctg gcgcgattta 1680 

tccgcgcaga cgatgacgtc actgcccggc 1740 

agttttttaa gtgacgtaaa atcgtgttga 1800 

ggcatccaac gccattcatg gccatatcaa 1860 

cggtgfcaagt gaactgcagt tgccatgttt 1920 

gtccggcggt gcttttgccg ttacgcacca 1980 

tgatagacac agaagccact ggagcacctc 2040 
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aaaaacacca tcatacacta aatcagtaag ttggcagcat cacccataat tgtggtttca 2100 

aaatcggctc cgtcgatact atgttatacg ccaactttga aaacaacttt gaaaaagctg 2160 

ttttctggta tttaaggttt tagaatgcaa ggaacagtga attggagttc gtcttgttat 2220 

aattagcttc ttggggtatc tttaaatact gtagaaaaga ggaaggaaat aataaatggc 2280 

fcaaaatgaga atatcaccgg aattgaaaaa actgatcgaa aaataccgct gcgtaaaaga 2340 

tacggaagga atgtctcctg ctaaggtata taagctggtg ggagaaaatg aaaacctata 2400 

tttaaaaatg acggacagcc ggtataaagg gaccacctat gatgtggaac gggaaaagga 2460 

catgatgcta tggctggaag gaaagctgcc tgttccaaag gtcctgcact ttgaacggca 2520 

tgatggctgg agcaatctgc fccatgagtga ggccgatggc gtcctttgct cggaagagta 2580 

tgaagatgaa caaagccctg aaaagattat cgagctgtat gcggagtgca tcaggcfcctt 2640 

tcactccatc gacatatcgg attgtcccta tacgaatagc ttagacagcc gcfctagccga 2700 

attggattac ttactgaata acgatctggc cgatgtggat tgcgaaaact gggaagaaga 2760 

cactccattt aaagatccgc gcgagctgta tgatttttta aagacggaaa agcccgaaga 2820 

ggaacttgtC ttttcccacg gcyeicutggg agacagcaac atcttfcgtga. oagatggcaa 288 0 

agtaagtggc tttattgatc ttgggagaag cggcagggcg gacaagtggt atgacattgc 2940 

cttctgcgtc cggtcgatca gggaggatat cggggaagaa cagtatgtcg agctattttt 3000 

tgacttactg gggatcaagc ctgattggga gaaaataaaa tattatattt tactggatga 3060 

attgttttag tacctagatg tggcgcaacg atgccggcga caagcaggag cgcaccgact 3120 

tcttccgcat caagfcgtttt ggctctcagg cqgaggccca cggcaagtat ttgggcaagg 3180 

ggtcgctggt attcgtgcag ggcaagattc ggaataccaa gtacgagaag gacggccaga 3240 

cggtctacgg gaccgacttc attgccgata aggtggatta tctggacacc aaggoaccag 3300 
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gcgggtcaaa tcaggaataa gggcacattg ccccggcgtg agtcggggca atcccgcaag 3360 

gagggtgaafc gaatcggacg tttgaccgga aggcatacag gcaagaactg atcgacgcgg 3420 

ggttttccgc cgaggatgcc gaaaccatcg caagccgcac cgtcatgcgt gcgccccgcg 3480 

aaaccttcca gtccgtcggc tcgatggfccc agcaagctac ggccaagatc gagcgcgaca 3540 

gcgtgcaact ggctccccct gccctgcccg cgccatcggc cgccgtggag cgttcgcgtc 3600 

gtctcgaaca ggaggcggca ggtttggcga agtcgatgac catcgacacg cgaggaacta 3660 

tgacgaut;aet gasgcgaaaa accgccggcg aggacctggc aaaaoaggto agcgaggcca 3720 

agcaggccgc gttgctgaaa cacacgaagc agcagatcaa ggaaatgcag ctttccttgt 3780 

tcgatattgc gccgtggccg gacacgatgc gagcgatgcc aaacgacacg gcccgctctg 3840 

ccctgttcac cacgcgcaac aagaaaatcc cgcgcgaggo gctgcaaaac aaggtcattt 3900 

tccacgtcaa caaggacgtg aagatcacct acaccggcgt cgagctgcgg gccgacgatg 3960 

acgaactggt gtggcagcag gtgttggagt acgcgaagcg cacccctatc ggcgagccga 4020 

tcaccttcac gttctacgag ctttgccagg acctgggctg gtcgatcaat ggccggtatt 4080 

acacgaaggc cgaggaatgc ctgtcgcgcc tacaggegac ggcg&tgggc ttcacgtccg 4140 

accgcgttgg gcacctggaa tcggtgtcgc tgctgcaccg cttccgcgtc ctggaccgtg 4200 

gcaagaaaac gtcccgttgc caggtcctga tcgacgagga aatcgtcgtg ctgtttgctg 4260 

gcgaccacta cacgaaattc atatgggaga agtaccgcaa gctgtcgccg acggcccgac 4320 

ggatgttcga ctatttcagc tcgcaccggg agccgtaccc gctcaagctg gaaaccfctcc 4380 

gcctcatgtg cggatcggat tccacccgcg tgaagaagtg gcgcgagcag gtcggcgaag 4440 

cctgcgaaga gttgcgaggc agcggcctgg tggaacacgc ctgggtcaat gatgacctgg 4500 

tgcattgcaa acgctagggc cttgtggggt cagttccggc tgggggttca gcagccagcg 4560 



WO 2004/063358 PCT/EP2004/000100 
311/358 

ctttactggc atttcaggaa caagcgggca ctgctcgacg cacttgcttc gctcagtatc 4620 

gctcgggacg cacggcgcgc fcctacgaact gccgataaac agaggattaa aattgacaat 4680 

tgtgattaag gctcagattc gacggcttgg agcggccgac gtgcaggafct tccgcgagat 4740 

ccgattgtcg gccctgaaga aagctccaga gatgttcggg tccgtttacg agcacgagga 4800 

gaaaaagccc atggaggcgt tcgctgaacg gttgcgagat gccgtggcat tcggcgccta 4860 

catcgacggc gagatcattg ggctgtcggt cttcaaacag gaggacggcc ccaaggacgc 4920 

tcacaaggcg catctgtceg gcgttttcgt ggagccogaa aagogaggoo gaggggtocrc 4980 

cggtatgctg ctgcgggcgt tgccggcggg tttattgctc gtgatgatcg tccgacagat 5040 

tccaacggga atctggtgga tgcgcatctt catccfccggc gcacttaata tttcgctatt 5100 

ctggagcttg ttgtttattt cggtctaccg cctgccgggc ggggtcgcgg cgacggtagg 5160 

cgctgtgcag ccgctgatgg tcgtgttcat ctctgccgct ctgctaggta gcccgatacg 5220 

attgatggcg gtcctggggg ctatttgcgg aactgcgggc gtggcgctgt tggtgttgac 5280 

accaaaogca gcgctagatc ctgtcggcgt cgcagcgggc ctggcggggg cggtttccafc 5340 

ggcgttcgga accgtgctga cccgcaagtg gcaaroLccc gtgcctctgc tcacctttac 5400 

cgcctggcaa ctggcggccg gaggacttct gctcgttcca gtagctttag tgtttgatcc 5460 

gccaatcccg atgcctacag gaaccaatgfc tctcggcctg gcgtggctcg gcctgatcgg 5520 

agcgggttta acctacttcc tttggttccg ggggatctcg cgactcgaac ctacagttgt 5580 

ttccttactg ggctttctca gccccagatc tggggtcgat cagccgggga tgcatcaggc 5640 

cgacagtcgg aacttcgggt ccccgacctg taccattcgg tgagcaatgg ataggggagt 57 00 
tgatatcgtc aacgttcact tctaaagaaa tagcgccact cagcttcctc agcggcttta 5760 
tccagcgatt tcctattatg tcggcatagt tctcaagatc gacagcctgt cacggttc^g 5820 
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cgagaaatga ataagaaggc tgataattcg gatctctgcg agggagatga tatttgatca 5880 

caggcagcaa cgctctgtca tcgttacaat caacatgcta ccctccgcga gatcatccgfc 5940 

gtttcaaacc cggcagctta gttgccgttc ttccgaatag catcggtaac atgagcaaag 6000 

tctgccgcct tacaacggcfc ctcccgctga cgccgtcccg gactgatggg ctgcctgtat 6060 

cgagtggtga ttttgtgccg agctgccggt cggggagctg ttggcfcggct ggtggcagga 6120 

tatattgtgg tgtaaacaaa ttgacgctta gacaacttaa taacacattg cggacgtttfc 6180 

taatgtactg gggtggtttt LcLtttcacc ogtgagacgg gcaaoagotg atfcgcccttc 6240 

accgcctggc cctgagagag ttgcagcaag cggtccacgc tggtttgccc cagcaggcga 6300 

aaatoctgtt tgatggtggt tccgaaatcg gcaaaatccc ttataaatca aaagaatagc 6360 

ccgagatagg gttgagtgtt gttccagttt ggaacaagag tccactatta aagaaegtgg 6420 

aatooaaogt caaagggrga aaaaccgtct atcagggcga tggcccacta cgtgaaccat 6480 

cacccaaatc aagfctttttg gggtcgaggt gccgtaaagc actaaatcgg aaccctaaag 6540 

ggagcccccg atttagagct tgacggggaa agccggcgaa cgtggcgaga aaggaaggga 6600 

agaaagcgaa aggagcgggc gecattcagg ctgcgcaact gttgggaagg gcgatcggtg 6660 

cgggcctctt cgctattacg ccagctggcg aaagggggat gtgctgcaag gcgattaagt 6720 

tgggtaacgc cagggttttc ccagtcacga cgttgtaaaa cgacggccag tgaattcgag 6780 

ctcggtaccc ggggatcttt cgacactgaa atacgtcgag cctgctccgc ttggaagcgg 6840 
cgaggagcct cgtcctgtca caactaccaa catggagfcae gataagggcc agttccgcca 6900 
gctcattaag agccagttca tgggcgttgg catgatggcc gfccatgcatc tgtacttcaa 6960 
gtacaccaac gctcttctga tccagtcgat catccgctga aggcgctttc gaatctggtt 7020 
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aagatccacg tcttcgggaa gccagcgact ggtgacctcc agcgtccctt taaggctgcc 7080 

aacagctttc tcagccaggg ccagcccaag accgacaagg cctccctcca gaacgccgag 7140 

aagaactgga ggggfcggtgt caaggaggag taagctcctt attgaagtcg gaggacggay 7200 

cggtgtcaag aggatattct tcgactctgt attatagata agatgatgag gaattggagg 7260 

taoeafcaoct tcatttaaat ttgctttcca ggctgagact ctagcttgga gcatagaggg 7320 

tcctttggct ttcaatattc tcaagtafcct cgagtttgaa cttattccct gtgaaccttt 7380 

tattcaccaa tgagcattgg aatgaacatg aatctgagga ctgcaatcgc catgaggttt 7440 

tcgaaataca tccggatgtc gaaggcttgg ggcacctgcg ttggttgaat ttagaacgtg 7500 

gcactattga tcatccgata gctctgcaaa gggcgttgca caatgcaagt caaacgttgc 7560 

tagcagttcc aggtggaatg ttatgatgag cattgtatta aatcaggaga tatagcatga 76ao 

tctctagtta gctcaccaca aaagtcagac ggcgtaacca aaagtcacac aacacaagct 7680 

gtaaggattt oggcaoggoh acggaagacg gagaagccac cttcagtgga ctcgagtacc 7740 

atttaattct atttgtgttt gatcgagacc taatacagcc cctacaacga ccatcaaagt 7800 
cgtatagcta ccagtgagga agtggactca aatcgacttc agcaacatct cctggataaa 7860 
ctttaagcct aaactataca gaataagata ggtggagagc ttataccgag ctcccaaatc 7920 
tgtccagatc atggttgacc ggtgcctgga tcttcctata gaatcatcct tattcgttga 7980 
cctagctgat tctggagtga cccagagggt catgacttga gcctaaaatc cgccgcctcc B040 
accatttgta gaaaaatgtg acgaactcgt gagctctgta cagtgaccgg tgactctttc 8100 
tggoatgcgg agagacggao ggacgcagag agaagggetg agtaataacjc cactggccag 8160 
acagctctgg cggotctgag gtgcagtgga tgattattaa tccgggaccg gccgcccctc 8220 
cgccccgaag tggaaaggct ggtgtgcccc tcgttgacca agaatctatt gcatcatcgg 82 80 
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agaatatgga gcttcatcga atcaccggca gtaagcgaag gagaatgtga agccaggggt 8340 

gtatagccgt cggcgaaata gcatgccatt aacctaggta cagaagtcca attgcttccg 8400 

atctggtaaa agattcacga gatagtacct tctccgaagt aggtagagcg agtacccggc 8450 

gcgtaagctc cctaattggc ccatccggca tctgtagggc gtccaaatat cgtgcctctc 8520 

ctgctttgcc cggtgtatga aacnggaaag gccgctcagg agctggccag- cggcgcagac 8580 

'cgggaacaca agctggcagt cgacccatcc ggtgctctgc actcgacctg ctgaggtccc 8640 

tcagtccctg gtaggcagct ttgccccgtc tgtccgcccg gtgtgtcggc ggggttgaca 8700 

aggtcgttgc gtcagtccaa catttgfctgc catattttcc tgctctcccc accagcfcgct 8760 

cttttcfcttt ctctttcttt fccccatcttc agtatattca tcttcccatc caagaacctt 8820 

tatttcccct aagtaagtac tttgctacat ccatactcca tccttcccat cccttattcc 8880 

tttgaacctt tcagttcgag ctttcccact tcatcgcagc ttgactaaca gctaccccgc 8940 

ttgagcagac atcaccatgc ctgaactcac cgcgacgtct gtcgagaagt ttctgatcga 9000 

aaagttcgac agcgtctccg acctgatgca gctctcggag ggcgaagaat ctcgtgcttt 9 060 

cagcttcgat gtaggagggc gtggatatgt cctgcgggta aatagctgcg ccgatggttt 9120 

ctacaaagafc cgttatgttt atcggcactt tgcatcggcc gcgctcccga ttccggaagt 9180 

gcttgacatt ggggaattca gcgagagcct gacctattgc atctcccgcc gtgcacaggg 9240 

tgtcacgttg caagacctgc ctgaaaccga actgcccgct gttctgcagc cggtcgcgga 9300 

ggccatggat gcgatcgctg cggccgatct tagccagacg agcgggttcg gcccattcgg 9360 

acogcaag-ga atoggtasat aeartfeafiafcer crcfftgafchtc afcatgegega fcfcgefcgafccn 9420 

ccatgtgtat cactggcaaa ctgtgatgga cgacaccgtc agtgcgtccg tcgcgcaggc 9480 

tctcgatgag ctgatgcttt gggccgagga ctgccccgaa gtccggcacc tcgtgcacgc 9540 
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ggatttcggc tccaacaatg tcctgacgga caatggccgc ataacagcgg tcattgactg 9600 

gagcgaggcg atgttcgggg attcccaata cgaggtcgcc aacatcfctct tctggaggcc 9660 

gtggttggct tgtatggagc agcagacgcg ctacttcgag cggaggcatc cggagcttgc 9720 

aggatcgccg cggctccggg cgtatatgct ccgcattggt cttgaccaac tctatcagag 9780 

cttggttgac ggcaatttcg atgatgcagc ttgggcgcag ggtcgatgcg acgcaatcgt 9840 

ccgatccgga gccgggactg tcgggcgtac acaaatcgcc cgcagaagcg cggccgtctg 9900 
gaccgatggc tgtgtagaag tactcgccga tagtggaaac cgacgcccca gcactcgtcc 9960 

gagggcaaag gaatagagta gatgccgacc gcgggatcga tccacttaac gttactgaaa 1002 0 

tcatcaaaca gcttgacgaa tctggatata agatcgttgg tgtcgatgtc agctccggag 10080 

ttgagacaaa tggtgttcag gatctcgata agatacgttc atttgtccaa gcagcaaaga 10140 

gfcgccttcta gtgatttaat agctccatgt caacaagaat aaaacgcgtt fctcgggttta 10200 

cctcttocag atacagctca tctgcaatgc attaatgcat tgactgcaac ctagtaacgc 10260 

cttncaggct ccggcgaaga gaagaatagc tfcagcagagc tattttcatt ttcgggagac 10320 

gagatcaagc agatcaacgg tcgtcaagag acctacgaga ctgaggaatc cgctcttggu 10380 

tccacgcgac tatatatttg tctctaattg tactttgaca tgctccfcctt ctttactctg 10440 

atagcttgac tatgaaaatt ccgtcaccag cncctgggtt cgcaaagata attgcatgtt 10500 

tcttccttga actctcaagc ctacaggaca cacattcatc gtaggtataa acctcgaaat 10560 

canttcctac taagatggta tacaatagta accatgcatg gttgcctagt gaatgctccg 10620 

taacacccaa tacgccggcc gaaacttttt tacaactctc cfcatgagtcg tttacccaga 10680 

atgcacaggt acactfcgttt agaggtaatc cttctttcta gctagaagtc ctcgtgtact 10740 

gtgtaagcgc ccactccaca tctccactcg acctgcaggc atgcaagctt gagattaaaa 10800 
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tagataagga aaagaaagtg aaaagaaatt cggaagcatg gcacafctctt ctttttataa 10860 

atacatgcct gactttcttt ttccatcgat atgatatafcg catatgatag afcatacaagc 10920 

aatcttcfctc aaggagtttg aaafctttgtc ctccaggagc aaaaaaaagt ttttttttat 10980 

acatgtttgt acacaagaat agttaccaat ttgctttggt cttacgtgct gcaagtttat 11040 

atcgttttca atttctttgt ctttacattt tetttgtcct ttatctttcc tcatttagtc 11100 

tttgggagaa ttaggaaaag ggagcggaaa ggtaagaaat gctfcgcgtat tttactaatt 11160 

cggcaaacat cuetatttggc aaacagoagc ctgtgcaacg ctctcgag-at gacagtatct 11220 

ttgattacac tctaaatctc gatgacccga ccaaaaagag cgaacaaaga aataatcttg 11280 

tgcattcgaa tatgatggaa gattttttcc cccttattct aaatgttgac atagcgtgta 11340 

tgttatataa acaaaaagaa attgtacaaa ctttcttttc ttctcfctttt atttfcatctc 11400 

tatgttgtgg atttggaatg ccctgabcgt tttcgttacc gtgattggca tggaagtgat 11460 

tgctgcactg gcacacaaat acatcatgca cggctggggt tggggatggc atctttcaca 11520 

tcatgaaccg cgtaaaggtg cgtttgaagt taacgatctt tatgccgtgg tttttgctgc 115 80 

attatcgatc ctgctgattt atctgggcag tzacaggaatg tggccgctcc agtggattgg 11640 

cgcaggtatg acggcgtatg gattactcta ttttatggtg cacgacgggc tggtgcatca 11700 

acgttggcca ttccgctata ttccacgcaa gggctacctc aaacggttgt atatggcgca 11760 

ccgtatgcat cacgccgtca ggggcaaaga aggttgtgtt tcttttggct tcctctatgc 11820 

gccgccccfcg tcaaaacttc aggcgacgct ccgggaaaga catggcgcta gagcgggcgc 11880 

tgccagagat gcgcagggcg gggaggatga gcccgcatcc gggaagfcaag ggcctgacca 11940 

gaggcggcaa gcagcagcgt taatttttcg ggcgtggtcg ttgactgccg ctgatcccaa 12000 

agcttgagat taaaatagat aaggaaaaga aagrtgaaaag aaattcggaa gcatggcaca 12060 
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ttcttctttt tataaataca tgcctgactt tctfctttcca tcgatatgat atatgcatat 12120 

gatagatata caagcaatct tcfctcaagga gtttgaaatt ttgtcctcca ggagcaaaaa 12180 

aaagtttttt tttatacatg tttgtacaca agaatagtta ccaafcttgct ttggtcttac 12240 

gtgabgcaag fcttatatcgfc tttcaatttc tttgtcttfca cattttcttt gtcctttatc 12300 

tttcctcatt tagtctttgg gagaattagg aaaagggagc ggaaaggtaa gaaatgcttg 12360 

cgtattttac taattcggca aacatccaat ttggcaaaca gcagcctgtg caacgctctc 12420 

gagatgamoig fcatctttgat tacactctaa atctcgatga cccgaocaaa aagagogaac 12480 

aaagaaataa tcttgtgcat tcgaatatga tggaagattt tttccccctt attctaaatg 12540 

ttgacatagc gtgtatgtta tataaacaaa aagaaattgt acaaactttc ttttcttctc 12600 

tttttatttt atctctatga tccagttaga acaaccactc agtcatcaag caaaactgac 12660 

tccagtactg agaagtaaat ctcagtttaa ggggcttttc attgctattg tcattgttag 12720 

cgcatgggtc attagcctga gtttattact ttcccttgac atctcaaagc taaaattttg 12780 

gatgttattg cctgttatac tatggcaaac atttttatat acgggattat ttattacatc 12840 

tcatgatgcc atgcatggcg tagtatttcc ccaaaacacc etagattaatu aLLtyattgy 12900 

aacattgacc ctatcccttt atggtctttt accatatcaa aaactattga aaaaacattg 12960 

gttacaccac cacaatccag caagctcaat agacccggat tttcacaatg gtaaacacca 13020 
aagtttcttt gcttggtatt ttcattttat gaaaggttac tggagttggg ggcaaataat . 13080 

tgcgttgact attatttata actttgctaa atacatactc catatcccaa gtgataatct 13140 

aacttacttt tgggtgctac cctcgctttt aagttcatta caattattct attttggtac 13200 

ttttfctaccc catagtgaac caataggggg ttatgttcag cctcattgtg cccaaacaat 13260 

tagccgtcct atttggtggt catttatcac gtgctatcat tttggctacc acgaggaaca 13320 
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tcacgaatat cctcatattt ettggtggca gttaccagaa atttacaaag caaaatagaa 13380 

gcttggcgta atcatggtca tagctgtttc ctgtgtgaaa ttgttatccg ctcacaattc 13440 

cacacaacat acgagccgga agcataaagt gtaaagcctg gggtgcctaa tgagtgagct 13500 

aactcacatt aattgcgttg cgctcactgc ccgctttcca gtcgggaaac ctgtcgfcgcc 13560 

agctgcatta atgaatcggc caacgcgcgg ggagaggcgg fcttgcgtatt gggccaaaga 13620 

caaaagggcg acattcaacc gattgaggga gggaaggtaa atattgacgg aaattattca 13680 

ttaaaggtga attatcaccg tuaccgetett gagucatLLg ggacttt-ctgag ccagcanaat 13740 

caccagtagc accattacca ttagcaaggc cggaaacgtc accaatgaaa ccatcgatag 13800 

cagcaccgta atcagtagcg acagaatcaa gtttgccttt agcgtcagac tgtagcgcgt 13860 

tttcatcggc attttcggtc atagccccct tattagcgtt tgccatcttt tcataatcaa 13920 

aatcaccgga accagagcca ccaccggaac cgcctccctc agagccgcoa ccctcagaac 13980 

cgccaccctc agagccacca ccctcagagc cgccaccaga accaccacca gagccgccgc 14040 

cagcattgac aggaggcccg atctagtaac atagatgaca ccgcgcgcga taatttatcc 14100 

tagtttgcgc gctatatttt gttttctatc gcgtattaaa tgtataattg cgggactcta 14160 

atcataaaaa cccatctcat aaataacgtc atgcattaca tgttaatfcat tacatgctta 14220 

acgtaattca acagaaatta tatgataatc atcgcaagac cggcaacagg attcaatctt 14280 

aagaaacttt attgccaaat gtthgaacga tcggggatca tccgggtctg tggcgggaac 14340 

tccacgaaaa tatccgaacg aagaaagata fccgcggfcgca tetcggtctt gcetggge&g 14400 

tcgccgccga cgccgttgat gtggacgccg ggcccgatca tattgtcgct caggatcgtg 14460 

gcgfctgtgct tgtcggccgt tgctgtcgta atgatatcgg caccttcgac cgcctgttcc 14520 
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gcagagatcc cgtgggcgaa gaactccagc atgagatccc cgcgctggag gatcatccag 14580 

ccggcgtccc ggaaaacgat tccgaagccc aacctttcat agaaggcggc ggtggaatcg 14640 

aaatctcgtg atggcaggtt gggcgtcgct tggtcggtca tttcgaaccc cagagtcccg 14700 

ctcagaagaa ctcgtcaaga aggcgataga aggcgatgcg ctgcgaatcg ggagcggcga 14760 

taccgtaaag caagaggaag cggtcagccc attcgccgcc aagctcttca gcaatatcac 14820 

gggtagccaa cgctatgtcc tgatagcggt ccgccacacc cagccggcca cagtcgatga 14880 

atccagaaaa gcggccattt tccaccatga tattcggcaa gcaggcatcg ccatgggtca 14940 

cgacgagatc atcgccgtcg ggcatgcgcg cctfcgagcct ggcgaacagfc tcggctggcg 15000 

cgagcccctg atgctcttcg tccagatcat cctgatcgac aagaccggct fcccatccgag 15060 

tacgtgctcg ctcgatgcga tgtttcgctt ggtggtcgaa tgggcaggfca gccggatcaa 15120 

gcgtatgcag ccgccgcatt gcatcagcca tgatggatac tttctaggca ggagcaaggt 15180 

gaaataacag gagatcctgc cccggcactt cgcccaatag cagccagtcc cttcccgctt 15240 

cagtgacaac gtcgagcaca gctgcgcaag gaacgcccgt cgtggccagc cacgatagcc 15300 

gcgctgcctc gtcctgcagt tcattcaggg caccggacag gtcggtcttg acaaaaagaa 15360 

ccgggcgccc ctgcgctgac agccggaaca cggcggcatc agagcagccg attgtctgtt 15420 

gtgcccagtc atagccgaat agcctctcca cccaagcggc cggagaaccfc gcgtgcaatc 15480 

catcttgttc aatcatgcga aacgatccag atccggtgca gattabttgg attgagagtg 15540 

aatatgagac tctaattgga taccgagggg aatttatgga aagtcagtgg agcatttttg 15600 

aoaagaaata tttgctagct gataerfcsjaoc thagrgegaet fcfcfcgaacgcg caataafcggt 15660 

ttctgacgta tgtgcfctagc tcattaaact ccagaaaccc gcggctgagt ggctccttca 15720 

acgttgcggt tctgtcagtt ccaaacgtaa aacggctfcgt cccgcgtcat cggcgggggt 15780 
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cataacgtga ctcccttaat tctccgctca tgatcagatt gtcgtttccc gccttcagtt 15840 

taaactatca gtgtttgaca ggatatattg gcgggtaaac ctaagagaaa agagcgttta 15900 

fcfcagaataat cggafcattta aaagggcgtg aaaaggttta tccgttcgtc catttgtatg 15960 

fcgcatgccaa ccacagggtt ccccagatct ggcgccggcc agcgagacga gcaagattgg 16020 

ccgccgcccg aaacgatccg acagcgcgcc cagcacaggt gcgcaggcaa attgcaccaa 16080 

cgcatacagc gccagcagaa tgccatagtg ggcggtgacg tcgttcgagt gaaccagatc 16140 

gcgcaggagg cccggcagca ccggcataat caggccgatg ccgacagcgt cgagcgcgac 16200 

agtgctcaga attacgatca ggggtatgtt gggtttcacg fcctggcctcc ggaccagcct 16260 

ccgctggtcc gattgaacgc gcggattctt tatcactgat aagttggtgg acatattatg 16320 

tttatcagtg ataaagtgtc aagcatgaca aagttgcagc cgaatacagt gatccgtgcc 16380 

gccctggacc tgttgaacga ggtcggcgta gacggtctga cgacacgcaa actggcggaa 16440 

oggttggggg tfcnageagee ggcgctttac tggcacttca ggaacaagcg ggcgctgctc 16500 

gacgcactgg ccgaagccat gctggcggag aatcatacgc attcggtgcc gagagccgac 16560 

gacgactggc gctcatttct gatcgggaat gcccgcagct tcaggcaggc gctgctcgcc 16620 

taccgcgatg gcgcgcgcat ccatgccggc acgcgaccgg gcgcaccgca gatggaaacg 16680 

gccgacgcgc agcttcgctt cctctgcgag gcgggttttt cggccgggga cgccgtcaat 16740 

gcgctgatga caatcagcta cttcactgtt ggggccgtgc ttgaggagca ggccggcgac 16800 

agcgatgccg gcgagcgcgg cggcaccgtt gaacaggctc cgctctcgcc gctgttgcgg 16860 

gccgcgatag acgoattcga agaagocggt ccggacgcag egttegagca ggganhrtgng 16920 

gtgattgtcg atggattggc gaaaaggagg ctcgttgtca ggaacgttga aggaccgaga 16980 

aagggtgacg attgatcagg accgctgccg gagcgcaacc cactcactac agcagagcca 17040 
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bgtagacaac atccccfcccc ccttfcccacc gcgtcagacg cccgtagcag cccgctacgg 17100 

gctttttcat gccctgccct agcgtecaag cctcacggcc gcgctcggcc tctctggcgg 17160 

ccfctctggcg cfccttccgct tcctcgctca ctgactcget gcgctcggtc gttcggctgc 172^0 

ggcgagcggt atcagctcac tcaaaggcgg taatacggtt atccacagaa tcaggggafca 172 80 

acgcaggaaa gaacatgtga gcaaaaggcc agcaaaaggc caggaaccgt aaaaaggccg 17340 

cgttgctggc gtttttccat aggctccgcc cccctgacga gcatcacaaa aatcgacgct 17400 

caagtcagag gtggcgaaac ccgacaggac tataaagata ccaggcgttt ccccctggaa 17460 

gctccctcgt gcgctctcct gttccgaccc tgccgcttac cggatacctg tccgccfcttc 17520 

tcccttcggg aagcgtggcg cttttccgct gcataaccct gcttcggggt cattatagcg 17580 

attttttcgg tatafcccatc ctttttcgca cgatatacag gattttgcca aagggtfccgt 17640 

gtagactttc cttggtgtat ccaacggcgt cagccgggca ggataggtga agfcaggccca 17700 

cccgcgagcg ggtgttcctt cttcactgtc ccttattcgc acctggcggt gctcaacggg 17760 

aatcctgcfcc tgcgaggctg gccggctacc gccggcgtaa cagatgaggg caagcggatg 17820 

gctgatgaaa ccaagccaac caggaagggc agcccaccta tcaaggtgta ctgccttcca 17880 

gacgaacgaa gagcgattga ggaaaaggcg gcggcggccg gcatgagcct gtcggcctac 17940 

ctgctggccg tcggccaggg ctacaaaatc acgggcgtcg tggactatga gcacgtccgc 18000 

gagctggccc gcatcaatgg cgacctgggc cgcctgggcg gcctgctgaa actctggctc 18060 

accgacgacc cgcgcacggc gcggttcggt gatgccacga fccctcgccct gctggcgaag 18120 

atcgaagaga agcaggacga gcttggcaag gtcatgatgg gcgtggtccg cccgagggca 18180 

gagccatgac ttttttagce gctaaaacgg ccggggggtg cgcgtgattg ccaagcacgt 18240 

ccccatgcgc tccatcaaga agagcgactt cgcggagctg gtgaagtaca tcaccgacga 183 00 
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gcaaggcaag accgagcgcc tttgcgacgc tea 



<210> 52 

<211> 17 

<212> TMA 

<213> Artificial 

<220> 

<223> Primer 



<220> 

<221> misc_feature 

<222> (3).. (3) 

<223> n is a, c, g, or t 

<220> 

<221> misc_feature 

<222> (9).. O) 

<223> n is a, c, g, or t 

<400> 52 

gengarggna thtggta 



<210> 53 

<211> 20 

<212> DMA 

<213> Artificial 

<220> 

<223> Primer 



<220>- 

<221> misc_feature 

<222> (3).. {3) 

<223> n is a, c, g, 



<220> 
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<221> inisc_featu.re 

<22Z> (6).. (6) 

<223> n is a, c, g, or t 

<400> 53 

tcngcnagra adatrttrtg 



<210> 54 

<211> 27 . 

<212> DKA 

<213> Artificial 

<220> 

<223> Primer 

<400> 54 

aagtgacacc ggttacacgc ttgtctt 



<210> 55 

<311> 27 

<212> DNA 

<213> Artificial 

<220> 

<223> Primer 

<400> 55 

gcttatcacc atctgttacc tccttgc 

<210> 56 

<211> 32 

<212> DNA 

<213> Artificial 



<22Q> 

<223> Primer 
<400> 56 

agagagggat ccttaaatgc gaatatcgtt gc 



32 
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<210> 57 

<211> 32 

<212> DNA 

<213> Artificial 

<220> 

<9.23> Primer 

<400> 57 

agagagggat ccatgtctga tcaaaagaag ca 



<210> 58 

<211> 37 

<212> DNA 

<213> Artificial 

<220> 

<223> Primer 

actttattgg atccttaaat gcgaatatcg ttgctgc 



<210> 59 

<211> 38 

<212> DNA 

<213> Artificial 

<220> 

<223> Primer 

<400> 59 

gttccaattg gccacatgaa gagtaagaca ggaaacag 

<210> 60 

<211> 38 

<212> DNA 

<213> Artificial 
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<220> 

<223> Primer 
<400> 60 

cctgtcttac tcttcatgtg gccaafctgga accaacac ' 



<:210> 61 

<211> 38 

<212> DNA 

<213> Artificial 

<220> 

<223> Primer 

<400> 61 

ctattttaat catatgtctg atcaaaagaa gcatattg 



<210> 62 

<211> 16103 

<212>- DNA 

<213> Artificial 

<220> 

<223> Primer 



<220> 

<221> raisc_feature 

<222> (3471) .. (3471) 

<223> n is a, c, g, or t 

<220> 

<221> misc„feature 
-=.222> (3679) . . (3679) 

<223> n is a, c, g, or t 

<220> 

<221> misc_feature 
<222> (3770) (3770) 



WO 2004/063358 PCT/EP2004/000100 
326/358 

<223> n is a, c, g, or t 

<400> 62 '■ 

gatctfctcga cactgaaata cgtcgagcct gctccgcttg gaagcggcga ggagcctcgt 60 

cctgtcacaa ctaccaacat ggagtacgat aagggccagt tccgccagct cattaagagc 120 

cagttcatgg gcgttggcat gatggccgfcc atgcatctgt acttcaagta caccaacgct 180 

cttctgatcc agtcgatcat ccgctgaagg cgctttcgaa tctggttaag atccacgtct 240 

tcgggaagcc agcgactggt gacctccagc gtccctttaa ggctgccaac agctttctca 300 

gccagggcca gcccaagacc gacaaggcct ucclocagaa cgccgagaag aactggaggg 360 

gtggtgtcaa ggaggagtaa gctccttatt gaagtcggag gacggagcgg tgtcaagagg 420 

stattcttcg actctgtatt atagataaga tgatgaggaa ttggaggtag catagcttca 480 

tttggatttg ctttccaggc tgagactcta gcttggagca tagagggtcc tttggctttc 540 

aatattctca agtatctcga gtttgaactt afctccctgtg aaccttttat tcaccaatga 600 

gcattggaat gaacatgaat ctgaggactg caatcgccat gaggttttcg aaatacafccc 660 

ggatgtcgaa ggcttggggc acctgcgttg gttgaattta gaacgtggca ctattgatca 720 

tccgatagct ctgcaaaggg cgttgcacaa tgcaagtcaa acgctgctag cagttucagg 780 

tggaatgtta tgatgagcat tgtattaaat caggagatat agcatgatcfc ctagttagct 840 

caccacaaaa gtcagacggc gtaaccaaaa gtcacacaac acaagctgta aggatttcgg 900 

cacggctacg gaagacggag aagccacctt cagtggactc gagtaccatt taattctafcfc 960 

tgtgtttgat cgagacctaa tacagcccct acaacgacca fccaaagtcgt atagctacca 1020 

gtgaggaagt ggactcaaat cgacttcagc aacatctcct ggataaactf fcaagcctaaa 1080 

ctatacagaa taagataggt ggagagctta taccgagctc ccaaatctgt ccagatcatg 1140 

gttgaccggt gcctggatct tcctatagaa tcatccttat tcgttgacct agctgattct 1200 
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ggagtgaccc agagggtcat gacttgagcc taaaatccgc cgcctccacc atttgtagaa 1260 

aaatgtgacg aactcgtgag ctctgtacag tgaccggtga ctctttctgg catgcggaga 1320 

gacggacgga cgcagagaga agggctgagt aataagccac tggccagaca gctctggcgg 1380 

ctctgaggtg cagtggatga ttattaatcc gggaccggcc gcccctccgc cccgaagtgg 1440 

aaaggctggt gtgcccctcg ttgaccaaga afcctattgca tcatcggaga atatggagct 1500 

tcatcgaatc accggcagta agcgaaggag aatgtgaagc caggggtgta tagccgfccgg 1560 

cgaaatagca tgccatfcaac ctaggtacag- aagtccaatt gcttccg-atc tggtaaaaga 1620 

ttcacgagat agtaccttct ccgaagtagg tagagcgagt acccggcgcg taagctccct 1680 

aattggccca tccggcatct gtagggcgtc caaatatcgt gcctctcctg ctttgcccgg 1740 

tgtatgaaac cggaaaggcc gctcaggagc tggccagcgg cgcagaccgg gaacacaagc 1800 

tggcagtcga cccatccggt gcfcctgcact cgacctgctg aggtccctca gtccctggta 1860 

ggcagctttg ccccgtctgt ccgcccggtg tgtcggcggg gttgacaagg fccgttgcgtc 1920 

agtccaacat ttgttgccat attttcctgc tctccccacc agctgctctt ttcttttctc 1980 

tttcttttcc catcttcagt atattcatct tcccatccaa gaacctttat ttucuct&ag 2040 

taagtacttt gctacatcca tactccatcc ttcccatccc ttattccttt gaaccfcttca 2100 

gttcgagctt tcccacttca tcgcagcttg actaacagct accccgcttg agcagacatc 2160 

accatgcctg aactcaccgc gacgtctgtc gagaagtttc tgatcgaaaa gttcgacagc 2220 

gtctccgacc tgatgcagct ctcggagggc gaagaatctc gtgctfctcag cttcgatgta 2280 

ggagggcgtg gatatgtcct gcgggtaaat agctgcgccg atggtttcta caaagatcgt 2340 

tatgtttatc ggcactttgc atcggccgcg cteccgattc cggaagtgct fcgacattggg 2400 

gaattcagcg agagcctgac ctattgcatc tcccgccgtg cacagggtgfc cacgttgcaa 2460 
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gacctgcctg aaaccgaact gcccgctgtt ctgcagccgg tcgcggaggc catggatgcg 2520 

atcgctgcgg ccgatcttag ccagacgagc gggttcggcc cattcggacc gcaaggaatc 2580 

ggtcaataca ctacatggcg tgatttcata tgcgcgattg ctgatcccca tgtgtatcac 2S40 

tggcaaactg tgatggacga caccgtcagt gcgtccgtcg cgcaggctct cgatgagctg 27 00 

atgctttggg ccgaggactg ccccgaagtc cggcacctcg' tgcacgcgga tttcggctcc 2760 

aacaatgtcc tgacggacaa tggccgcata acagcggtca ttgactggag cgaggcgatg 2820 

ttcggggatt cccaatdcyd ggtggccaac afccttcfctct ggaggccgtg gttggcfcfcgfc 2 880 

atggagcagc agacgcgcta cttcgagcgg aggcatccgg agcttgcagg atcgccgcgg 2940 

ctccgggcgt atatgctccg cattggtctt gaccaactct atcagagctt ggttgacggc 3000 

aatttcgatg atgcagcttg ggcgcagggt cgatgcgacg caatcgtccg atccggagcc 3060 

gggactgtcg ggcgtacaca aatcgcccgc agaagcgogg ccgtctggac cgatggctgt 3120 

gtagaagtac tcgccgatag tggaaaccga cgccccagca ctcgtccgag ggcaaaggaa 3180 

tagagtagat gccgaccgcg ggatcgatcc acttaacgtt actgaaatca tcaaacagct 3240 

tgacgaatct ggatataaga tcgttggtgt cgatgtcagc tccggagttg agacaaatgg 3300 

tgttcaggat ctcgataaga tacgttcatt tgtccaagca gcaaagagtg ccfctctagtg 3360 

atttaatagc tccatgtcaa caagaataaa acgcgttttc gggtttacct cttccagafca 3420 

cagctcatct gcaatgcatt aatgcattga ctgcaaccta gtaacgcctt ncaggctccg 3480 

gcgaagagaa gaatagctta gcagagctat tttcattttc gggagacgag afccaagcaga 3540 

tcaacggtcg tcaagagacc tacgagactg aggaatccgc tcttggctcc acgcgactat 3600 

atatttgtct cfcaattgtac tttgacatgc tcctcttctt tactctgata gcttgactat 3660 

gaaaattccg tcaccagcnc ctgggttcgc aaagataatt gcatgtttct tccttgaact 3720 
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ctcaagccta caggacacac attcatcgta ggtataaacc tcgaaatcan ttcctactaa 3780 

gatggtatac aatagtaacc atgcatggtt gcctagtgaa tgctccgtaa cacccaatac 3840 

gccggccgaa acttttttac aacfcctccta tgagtcgttt acccagaatg cacaggtaca 3900 

cttgtttaga ggtaatcctt ctttctagct agaagtcctc gfcgtactgtg taagcgccca 3960 

ctccacatct ccactcgacc tgcaggcafcg caagcttgag tctatcgcct ccaaaaagta 4020 

cggtgctgaa ttcagatatc aatcgcctgt tgctaaaatt aacactgtcg ataaagacaa 4080. 

gcgtgtaacc ggtgtcactt tggaaagcyg ayaaytcaLt yaagrccgaty caytcytatg 4140 

taatgcggat cttgtttatg cttatcacca tctgttacct ccttgcaatt ggacaaagaa 4200 

gacattagcc tcaaagaaac tcacttcatc atctatttcg ttttattggt ccafcgtcaac 4260 

aaaggtgcct caattagacg tacacaatat cttcttggct gaagcctaca aggaaagttt 4320 

tgatgagatt ttcaacgact tcggtttgcc ctctgaagct tggcgtaatc atggtcatag 4380 

ctgtttcctg tgtgaaattg ttatccgctc acaattccac acaacatacg agccggaagc 4440 

ataaagtgta aagcctgggg tgcctaatga gtgagctaac tcacattaat tgcgttgcgc 4500 

tcactgcccg ctttccagtc gggaaacctg tcgtgccagc tgcattaatg aatcggccaa 4550 

cgcgcgggga gaggcggttt gcgtattggg ccaaagacaa aagggcgaca ttcaaccgat 4620 

tgagggaggg aaggtaaata ttgaoggaaa ttattcatta aaggtgaatt atcaccgtca 4680 

ccgacttgag ccatttggga attagagcca gcaaaatcac cagtagcacc attaccatta 4740 

gcaaggccgg aaacgtcacc aatgaaacca tcgatagcag caccgtaatc agtagcgaca 4800 

gaatcaagtt tgcctttagc gtcagactgt agcgcgtttt catcggcatt ttcggtcata 4 8 SO 

gcccccttat tagcgtttgc catcttttca taatcaaaat caccggaacc agagccacca 4920 

ccggaaccgc ctccctcaga gccgccaccc tcagaaccgc caccctcaga gccaccaccc 4980 
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tcagagccgc cac'cagaacc accaccagag ccgccgccag cattgacagg aggcccgatc 5040 

tagtaacata gatgacaccg cgcgcgataa tttatcctag tttgcgcgct atattttgtt 5100 

ttctatcgcg tattaaatgt ataattgcgg gactcfcaatc ataaaaaccc atctcataaa 5160 

taacgtcatg cattacatgt taattattac atgcttaacg taattcaaca gaaattatat 5220 

gataatcatc gcaagaccgg caacaggatt caatcttaag aaactttatt gccaaatgtt 5280 

' tgaacgatcg gggatcatcc gggtctgtgg cgggaactcc acgaaaatat ccgaacgcag 53 40 

caagatatcg cggtgcatct cgyLuttgfcc tgggcagfccg oogoogacge cgfcfcgafcgtg 5400 

gacgccgggc ccgatcatat tgtcgctcag gatcgtggcg ttgtgcttgt cggccgttgc 5460 

tgtcgtaatg atatcggcac cttcgaacgc ctgttccgca gagatcccgt gggcgaagaa 5520 

ctccagcatg agatccccgc gctggaggat catccagccg gcgtcccgga aaacgattcc 5580 

gaagoccaac otttcafcaga aggcggcggt ggaatcgaaa tctcgtgatg gcaggttggg 5640 

cgtcgcttgg tcggtcattt cgaaccccag agtcccgctc agaagaactc gtcaagaagg 5700 

cgatagaagg cgatgcgctg cgaatcggga gcggcgatac cgtaaagcac gaggaagcgg 5760 

tcagcccatt cgccgccaag ctcttcagca atatcacggg tagccancgc tafcgtcctga S820 

tagcggtccg ccacacccag ccggccacag tcgatgaatc cagaaaagcg gccattttcc 5880 

accatgatat tcggcaagca ggcatcgcca tgggtcacga cgagatcatc gccgtcgggc 5940 

atgcgcgcct tgagcctggc gaacagfctcg gctggcgcga gcccctgatg ctcttcgtcc 6000 

agatcatcct gatcgacaag accggcttcc atccgagtac gtgctcgctc gatgcgatgt 6060 

ttcgcttggt ggtcgaatgg gcaggtagcc ggatcaagcg tatgcagccg ccgcattgca 6120 

tcagccatga tggatacttt ctcggcagga gcaaggtgag atgacaggag atcctgcccc 6180 

ggcacttcgc ccaatagcag ccagtccctt cccgcttcag tgacaacgtc gagcacagct 6240 
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gcgcaaggaa cgcccgtcgt ggccagccac gatagccgcg ctgcctcgtc ctgcagttca 6300 

ttcagggcac cggacaggtc ggtcttgaca aaaagaaccg ggcgcccctg cgctgacagc 6360 

cggaacacgg cggcatcaga gcagccgatt gtctgttgtg cccagtcata gccgaatagc 6420 

ctctccaccc aagcggccgg agaacctgcg tgcaatccat cttgttcaat catgcgaaac 6480 

gatccagatc cggtgcagat tatttggatt gagagtgaat atgagactct aattggatac 6540 

cgaggggaat ttatggaacg tcagtggagc atttttgaca agaaatattt gctagctgat 6600 

agtgacctta ggcgactttt g^cgcgcaa taatggtttc tgacgtafcgfc gcfctagotr.a 6660 

ttaaactcca gaaacccgcg gctgagtggc tccttcaacg ttgcggttct gtcagttcca 6720 
aacgtaaaac ggcttgtccc gcgtcatcgg cgggggtcat aacgtgactc ccttaattct 6780 
ccgctcatga tcagattgtc gtttcccgcc ttcagtttaa actatcagtg tttgacagga 6840 
tatattggcg ggtaaaccta agagaaaaga gcgtttatta gaataatcgg atatttaaaa 6900 
gggcgtgaaa aggtttatcc gttcgtccat ttgtatgtgc atgccaacca cagggttccc 6960 
cagatctggc gccggccagc gagacgagca agattggccg ccgcccgaaa cgatccgaca 7020 
gcgcgcccag cacaggtgcg caggcaaatt gcaccaa^yu stacagcgcc eigcagaatgo 7080 
catagtgggc ggtgacgtcg ttcgagtgaa ccagatcgcg caggaggccc ggcagcaccg 7140 
gcataafccag gccgatgccg acagcgtcga gcgcgacagt gctcagaatt acgatcaggg 7200 
gtatgttggg tttcacgtct ggcctccgga ccagcctccg ctggtccgat tgaacgcgcg 7260 
. gattctttat cactgataag ttggfcggaca tattatgttt atcagtgata aagtgtcaag 7320 
catgacaaag ttgcagccga atacagfcgat ccgtgccgcc ctggacctgt tgaacgaggt 7380 
cggcgtagac ggtctgacga cacgcaaact ggcggaacgg ttgggggttc agcagccggc 7440 
gotttactgg cacttcagga acaagcgggc gctgctcgac gcactggccg aagccatyct 7500 
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ggcggagaat catacgcatt cggtgccgag agccgacgac gactggcgct catttctgat 7560 
cgggaatgcc cgcagcttca ggcaggcgct gctcgcctac cgcgatggcg cgcgcatcca ,7620 

tgccggcacg cgaccgggcg caccgcagat ggaaacggcc gacgcgcagc ttcgcttcct 7680 

ctgcgaggcg ggtttttcgg ccggggacgc cgtcaatgcg ctgatgacaa tcagctactt 7740 

cactgttggg gccgtgcttg aggagcaggc cggcgacagc gatgccggcg agcgcggcgg 7800 

caccgttgaa caggctccgc tctcgccgct gttgcgggcc gcgafcagacg ccttcgacga 7860 

agccggtccg gacgcagcgt tcgagueiygg actcgcggfcg afctgtcgatg ga.tfcggagaa 702 0 

aaggaggcfcc gttgtcagga acgttgaagg accgagaaag ggtgacgatt gatcaggacc 7980 

gctgccggag cgcaacccac tcactacagc agagccatgt agacaacatc ccctccccct 8040 

fctccaccgcg fccagacgccc gtagcagccc gcfcacgggct ttttcatgcc ctgccctagc 8100 

gtccaagcct cacggccgcg ctcggcctct ctggcggcct tctggcgctc ttccgcttc.c 8160 

tcgchcactg actcgctgcg ctcggtcgtt cggctgcggc gagcggtatc agctcactca 822 0 

aaggcggtaa tacggttatc cacagaatca ggggataacg caggaaagaa catgbgagca 8280 

aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt tgctygcyUt tttccatagg 8340 

ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa gtcagaggtg gcgaaacccg 8400 

acaggactat aaagatacca ggcgtttccc cctggaagct ccctcgtgcg ctctcctgtt 8460 

ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc cttcgggaag cgtggcgctt 8520 

ttccgctgca taaccctgct tcggggtcat tatagcgatt ttttcggtat atccatcctt 8580 

tttcgcacga tatacaggat tttgccaaag ggttcgtgta gactttcctt ggtgtatcca 8640 

acggcgtcag ccgggcagga taggtgaagt aggeccaccc gcgagcgggt gttccttctt 8700 

cactgtccct tattcgcaoc tggcggtgct caacgggaat cctgctctgc gaggctggcc 8760 
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ggctaccgcc ggcgtaacag atgagggcaa gcggatggct gatgaaacca agccaaccag 8820 

gaagggcagc ccacctatca aggtgtactg ccttccagac gaacgaagag cgattgagga 8880 

aaaggcggcg gcggccggca tgagcctgtc ggcctacctg ctggccgtcg gccagggcta 8940 

caaaatcacg ggcgtcgtgg actatgagca cgtccgcgag ctggcccgca tcaatggcga 9000 

cctgggccgc ctgggcggcc tgctgaaact ctggctcacc gacgacccgc gcacggcgcg 9060 

gttcggtgat gccacgatcc tcgccctgct ggcgaagatc gaagagaagc aggacgagct 9120 

tggcaaggtc atgatgggcg tggtccgcce gagggcagag ccatgacttt fcttagcagct 9180 

aaaacggccg gggggfcgcgc gtgattgcca agcacgtccc catgcgctcc atcaagaaga 9240 

gcgacttcgc ggagctggtg aagtacatca ccgacgagca aggcaagacc gagcgccttt 9300 

gcgacgctca ccgggctggt tgccctcgcc gctgggctgg cggccgfccta tggccctgca 9360 

aacgcgccag aaacgccgtc gaagccgtgt gcgagacacc gcggccgccg gcgttgtgga 942 0 

tacctcgcgg aaaacttggc cctcactgac agatgagggg cggacgttga cacttgaggg 9480 

gccgactcac ccggcgcggc gttgacagat gaggggcagg ctcgatttcg gccggcgacg 9540 

tggagctggc cagcctcgca aatcggcgaa aacgcctgat ttxacgcgag ttLcccaoag 9600 

atgatgtgga caagcctggg gataagtgcc ctgcggtatt gacacttgag gggcgcgact 9660 

actgacagat gaggggcgcg atccttgaca cttgaggggc agagtgctga cagatgaggg 9720 

gcgcacctat tgacatttga ggggctgtcc acaggcagaa aatccagcat ttgcaagggt 9780 

ttccgcccgt ttttcggcca ccgctaacct gtcttttaac ctgcttttaa accaatattt 9840 

ataaaccttg tttttaacca gggctgcgcc ctgtgcgcgt gaccgcgcac gccgaagggg 9900 

ggtgcccccc cttctcgaac cctcccggcc cgctaacgcg ggcctcccat ccccccaggg 9960 

gctgcgcccc tcggccgcga acggcctcac cccaaaaatg gcagcgctgg cagtccctgc 10020 
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cafctgccggg afccggggcag taacgggatg ggcgatcagc ccgagcgcga cgcccggaag 10080 

cattgacgtg ccgcaggtgc tggcatcgac attcagcgac caggtgccgg gcagtgaggg 10140 

cggcggcctg ggtggcggcc tgcccttcac ttcggccgtc ggggcattca cggacttcat 10200 

ggcggggccg gcaattttta ccttgggcat tcttggcata gtggtcgcgg gtgccgtgct 10260 

cgtgfctcggg ggtgcgataa acccagcgaa ccatttgagg tgataggtaa gattataccg 10320 

aggtatgaaa acgagaattg gacctttaca gaafctactct atgaagcgcc atattfcaaaa 10380 

ayuLeujaaay ocyaayayca LyaayayyaL yaggaygcag attgccttga atatattyau 10440 

aatactgata agataatata tcttttatat agaagatatc gccgtatgta aggatttcag 10500 

ggggcaaggc ataggcagcg cgcttatcaa tatatctata gaatgggcaa agcataaaaa 10560 

cttgcatgga ctaatgcttg aaacccagga caataacctt atagcttgta aattctatca 10620 

taattgggta atgactccaa cttattgata gtgttttatg ttcagataafc gcccgatgac 10680 

tttgtcatgc agctccaccg attttgagaa cgacagcgac ttccgtccca gccgtgccag 10740 

gtgctgcctc agattcaggt tatgccgctc aattcgctgc gtatatcgct tgctgattac 10800 

gtgcagcttt cccttcaggc gggattcata cagcggccag ccatccgtca tccatatcac 10860 

cacgtcaaag ggtgacagca ggctcataag acgccccagc gtcgccatag tgcgttcacc 10920 

gaatacgtgc gcaacaaccg tcttccggag actgtcatac gcgtaaaaca gccagcgctg 10980 

gcgcgattta gccccgacat agccccactg ttcgtccatt tccgcgcaga cgatgacgtc 11040 

actgcccggc tgtatgcgcg aggttaccga ctgcggcctg agtttfcttaa gtgacgtaaa 11100 

atcgtgttga ggccaacgcc cataatgcgg gctgttgcoc ggcatccaac gccattcatg 11160 

gccatatcaa tgattttctg gtgcgtaccg ggttgagaag cggtgtaagt gaacfcgcagt 11220 

tgceatgttt tacggcagtg agagcagaga tagcgctgat gtccggcggt gctfcttgccg 11280 
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ttacgcacca ccccgtcagt agctgaacag gagggacagc tgatagacac agaagccact 11340 

ggagcacctc aaaaacacca tcatacacfca aatcagtaag ttggcagcat cacccataat 11400 

tgtggtttca aaatcggctc cgtcgatact atgttatacg ccaactttga aaacaacttt 11460 

gaaaaagcfcg ttttctggta tttaaggttt tagaatgcaa ggaacagtga attggagttc 11520 

gtcttgttat aattagcttc ttggggtatc tttaaatact gtagaaaaga ggaaggaaat 11580 

aataaatggc taaaatgaga atatcaccgg aattgaaaaa actgatcgaa aaataccget 11640 

gcgtaaaaga tacggaciggci aLgtcLcctg ctctaggtato. taagctggtg ggag&aa.afcg 11700 

aaaacctata tttaaaaatg acggacagcc ggtataaagg gaccacctat gatgtggaac 117 60 

gggaaaagga catgatgcta tggctggaag gaaagchgcc tgttccaaag gtcctgcact 11820 

ttgaacggca tgatggctgg agcaatctgc tcatgagtga ggccgatggc gtcctttgct 11880 

cggaagagta tgaagatgaa caaagcccfcg aaaagattat cgagcbgtat gcggagtgca 11940 

tcaggctctt tcactccatc gacatatcgg attgtcccta tacgaatagc ttagacagcc 12000 

gcttagccga attggattac ttacfcgaata acgatctggc cgatgtggat tgcgaaaact 12060 

gggaagaaga cactccattt aaagatccgc gcgagctgta tgatttttta aagacggaaa 12120 

agcccgaaga ggaacttgtc ttttcccacg gcgacctggg agacagcaac atctttgtga 12180 

aagatggcaa agtaagtggc tttattgatc ttgggagaag cggcagggcg • gacaagtggt 12240 

atgacattgc ctfcctgcgtc cggtcgatca gggaggafcafc cggggaagaa cagtatgtcg 123 00 

agctattttt tgacttactg gggatcaagc ctgattggga gaaaataaaa tattatattt 12360 

tactggatga attgttttag tacctagatg tggcgcaacg atgccggcga caagcaggag 12420 

cgcaccgact tcttccgcat caagtgtttt ggctctcagg ccgaggccca cggcaagtat 12480 

ttgggcaagg ggtcgctggt attcgtgcag ggaaagattc ggaataccaa gtacgagaag 12540 
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12600 
12660 



gacggccaga cggtctacgg gaccgacttc attgccgata aggtggatta tctggacacc 
aaggcaccag gcgggtcaaa tcaggaataa gggcacattg ccccggcgtg agtcggggca 
atcccgcaag gagggtgaat gaatcggacg tttgaccgga aggcatacag gcaagaactg 1272 0 
atcgacgcgg ggttttccgc cgaggatgcc gaaaccatcg caagccgcac cgtcatgcgt 12780 
gcgccccgcg aaaccttcca gtccgtcggc tcgatggtcc agcaagctac ggccaagatc 12840 
gagcgcgaca gcgtgcaact ggctccccct gccctgcccg cgccatcggc cgccgtggag 12900 
cgt'tcgcgtc gtctcgaaca ggaggcggca ggtULggcga agtcgatgac catogaoacg 12960 
cgaggaacta tgacgaccaa gaagcgaaaa accgccggcg aggacctggc aaaacaggfcc 
agcgaggcca agcaggccgc gttgctgaaa cacacgaagc agcagatcaa ggaaatgcag 13 
ctttccttgt tcgatattgc gccgtggccg gacacgatgc gagcgatgcc aaacgacacg 13140 
gcccgctctg occtgttcac cacgcgcaac aagaaaatcc cgcgcgaggc gctgcaaaac 
aaggtcattt tccacgtcaa caaggacgtg aagatcacct acaccggcgt cgagctgcgg 
gccgacgatg acgaactggt gtggcagcag gtgttggagt acgcgaagcg cacccctatc 
ggcgagccga tcaccttcac gttctacgag ctttgccagg acctgggctg gtcgatcaat 13380 
ggccggtatt acacgaaggc cgaggaatgc ctgfccgcgcc tacaggcgac ggcgatgggc 13440 
ttcacgtccg accgcgttgg gcacctggaa tcggtgtcgc tgctgcaccg cttccgcgtc 13500 
ctggaccgtg gcaagaaaac gtcccgttgc caggtcctga tcgacgagga aatcgtcgtg 13560 
ctgtttgctg gcgaccacta cacgaaattc atatgggaga agtaccgcaa gctgtcgccg 13620 
acggcccgac ggatgttcga ctatttcagc tcgcaccggg agccgtaccc gctcaagctg 13680 
gaaaccfctcc gcctcatgtg cggatcggat tccacccgcg tgaagaagtg gcgcgagcag 13740 
gtcggcgaag cctgcgaaga gttgcgaggc agcggcctgg tggaacacgc ctgggtcaat 13800 



13020 



1080 



13200 
13260 
13320 
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gatgacctgg tgcattgcaa acgctagggc cttgtggggt cagttccggc tgggggttca 13860 

gcagccagcg ctttactggc atttcaggaa caagcgggca ctgctcgacg cacttgcttc 13920 

gctcagtatc gctcgggacg cacggcgcgc tctacgaact gccgataaac agaggattaa 13980 

aattgacaat tgtgattaag gctcagattc gacggcttgg agcggccgac gtgcaggatt 14040 

tccgcgagat ccgattgtcg gccctgaaga aagctccaga gatgttcggg tccgtttacg 14100 

agcacgagga gaaaaagccc atggaggcgt tcgctgaacg gttgcgagat gccgtggcat 14160 

tcggccrccta catcgncggc gagatcafctg ggrctgfccggt cttcaaacag gaggacggce 14220 

ccaaggacgc tcacaaggcg catctgtccg gcgttttcgt ggagcccgaa cagcgaggcc 14280 

gaggggtcgc cggtatgctg ctgcgggcgt tgccggcggg tttattgctc gtgatgatcg 14340 

tccgacagat tccaacggga atctggtgga tgcgcatctt catcctcggc gcacttaata 14400 

tttcgctatt ctggagcttg ttgtttattt cggtctaccg cctgccgggc ggggtcgcgg 14460 

cgacggtagg cgctgtgcag ccgctgatgg tcgtgttcat ctctgccgct ctgctaggta 14520 

gcccgatacg attgatggcg gtcctggggg ctatttgcgg aactgcgggc gtggcgctgt 14580 

tggtgttgac accaaacgca gcgctagatc ctgtcggcgt cgcagcgggc ctggcggggg 14640 

cggtfctccat ggcgttcgga accgtgctga cccgcaagtg gcaacctccc gtgcctctgc 14700 

tcacctttac cgcctggcaa ctggcggccg gaggacttct gctcgttcca gtagctttag 14760 

tgtttgatcc gccaatcccg atgcctacag gaaccaatgt tctcggcgtg gcgtggctcg 14820 

gcctgatcgg agcgggttta acctacttcc tttggttccg ggggatctcg cgactcgaac 14880 

ctacagttgt ttccttactg ggctttctca gccccagatc tggggtcgat cagccgggga 14940 

tgcatcaggc cgacagtcgg aacttogggt ccccgacctg taccattcgg tgagcaatgg 15000 

ataggggagt tgatatcgtc aacgttcact tctaaagaaa tagcgccact cagcttcctc 15060 
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agcggcttta tccagcgatt tcctattatg tcggcatagt tctcaagatc gacagcctgt 15120 
cacggttaag cgagaaatga ataagaaggc tgataattcg gatctctgcg agggagatga 15180 
tatttgatca caggcagcaa cgctctgtca tcgttacaat caacatgcta ccctccgcga 15240 
gatcatccgt gtttcaaacc cggcagctta gttgccgttc ttccgaatag catcggtaac 15300 
atgagcaaag tctgccgcct tacaacggct ctcccgctga cgccgtcccg gactgatggg 15360 
ctgcctgtat cgagtggtga ttttgtgccg agctgccggt cggggagctg ttggctggct 15420 
ggtggcagga tatattgtgg tgtaaacaaa ttgaugetta gacaacttaa taacacatfcg 1E480 
cggacgtttt taatgtactg gggtggtttt tcttttcacc agtgagacgg gcaacagctg 15540 
attgccottc accgcctggc cctgagagag ttgcagcaag cggtccacgc tggtttgccc 15600 
cagcaggcga aaatcctgtt tgatggtggt tccgaaatcg gcaaaatccc ttataaatca 15660 
aaagaatagc ccgagatagg gttgagtgtb gttccagttt ggaacaagag tccactatta 15720 
aagaacgtgg actccaacgt caaagggcga aaaaccgtct atcagggcga tggcccacta 15780 
cgtgaaccat cacccaaatc aagttttttg gggtcgaggt gccgtaaagc actaaatcgg 
aaccctaaag ggagcccccg atttagagct tgacggggaa agccggcgaa cgLgyoyaga 
aaggaaggga agaaagcgaa aggagcgggc gccattcagg ctgcgcaact gttgggaagg 15960 
gcgatcggtg cgggcctctt cgctattacg ocagctggcg aaagggggat gtgctgcaag 16020 
gcgattaagt tgggtaacgc cagggfctttc ccagtcacga cgttgtaaaa cgacggccag 16080 
tgaattcgag ctcggtaccc ggg 16103 



15840 
15900 



<210> 63 

<211> 25 

<212> DMA 

<213> Artificial _ 



WO 2004/063358 



339/358 



PCT/EP2004/000100 



<220> 

<223>. Primer 



<400> 63 

ggcgtacttg aaggaaccct taccg 



-<210> 64 

<211> 25 

<212> DNA 

<213> Artificial 

<220> 

_<223> Primer 

<400> 64 

attgatgctc ccggtcaccg bgatt 



<210> 65 

<211> 500 

<212s- DNA 

<213> Blakeslea trispora 



<400> 65 

aatctataca atgctccata gactcacatt gatattgtcg aagatttcga tgctgactta 60 

gtagagcaac tacaaaagtt agcagagaag catgatttct taatctttga agaccgcaag 120 

tttgcagata tcggtatgtg aattctatct attttttttc tgatgtgtgc atggatgact 180 

catgatcata ttcttaggta atactgtcaa gcatcaatat ggcaagggcg tttacaagat 240 

tgcttcttgg tctcatatta ctaatgctca cacagttcct ggagaaggta ttatcaaggg 300 

acttgccgaa gtcggcctcc ctcttggfceg fcgsjcttgott tfcgetagcaa aaatgtcatc 360 

tcaaggtgca ttaactaagg gtatttacac tgccgaatct gtcaatatgg ctcgccgcaa 420 

caaagatttc gtttttggct ttattgcaca acacaaaatg aatcagtatg atgatgagga 480 
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<210> 66 
<2X1> 611 
<212> DKA 

<213> Elakeslea trispora 
<400> 66 

gagatfcaaaa fcagataagga aaagaaagtg aaaagaaatt cggaagcatg gcacattctt 60 

ctttttataa atacatgcct gactttcttt ttccatcgat atgatatatg catatgatag 120 

atato.ca.ctgc aatcUUcLLc aaggayttLg aaattttgtc ctccaggagc aaaaaaaagt 180 

ttttttttat acatgtttgt acacaagaat agttaccaafc ttgctttggt cttacgtgct 240 

gcaagtttat atcgttttca atttctttgt ctttaoattt tctttgtcct ttatctttcc 300 

tcatttagtc tttgggagaa ttaggaaaag ggagcggaaa ggtaagaaat gcttgcgtat 360 

tttactaatt cggcaaacat ccaatttggc aaacagcagc ctgtgcaacg ctctcgagat 420 

gacagtatct ttgattacac tctaaatctc gatgacccga ccaaaaagag cgaacaaaga 480 

aataatcttg tgcabtcgaa tatgatggaa gattttttcc cccttattct aaatg^tgac 540 

atagcgtgta tgttatataa acaaaaagaa attgtacaaa ctttcttttc ttctcttttt 60 0 

attttatctc t 611 



<210> 67 

<2ll> 720 

<212> DKA 

<213> Bl'akeslea trispora 



<400> 67 

atgtcaatac tcacttatct ggaatttcat ctctactata cactacctgt ccttgcggca 



ttgtgttggc tgctaaagcc gtttcactca cagcaagaca atctcaagta taaattttta 



60 
120 
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atgttgatgg ccgcctctac cgcatcgatt tgggacaatt atatcgttta tcatcgcgct 180 

tggtggtact gfccctacttg tgttgtggct gtcattggct atgtacctct agaagaatac 240 

atgttcttta -tcatcatgac fcttaatgact gtcgegttct caaactttgt tatgcgttgg 300 

cacttgcata ctttctttat tagacccaac acttcttgga agcaaacact attagtacgc 360 

cttatgcctg tttcagcttt attggcaatc acttatcatg cttggcactt gacactgcca 420 

aataaacctt cattttatgg ttcatgcatc ctttggtatg cttgtcctgt gttggctatt 480 

ctttggctgg gtgctggcga atatatcttg cgtcgacctg tggctgtcct tttgtctatt 540 

gttatcccta gtgtatacct atgttgggct gatatcgtcg ctattagtgc tggcacatgg 600 

catatttctc ttagaacaag cactggcaaa atggtagtac ccgatttacc tgtagaagaa 660 

tgcctgtttt ttactttgat caacacagtc ttggtttttg ctacctgtgc tatagaccgc 720 

<210> 68 
<211> 1089 
<212> DNA 

<213> Blakeslea trispora 
<400> 68 

ctgtacaaat catctgtfcca aaatcaaaac cctaaacaag ccatttccct tttccagcat 60 

gtcaaagagc tagcatgggc cttctgtctt cctgaccaaa tgctcaacaa tgaafctgttt 120 

gatgatctta ctatcagctg ggatatttta cgtaaagcct caaagtcatt ctafcactgca 180 

tctgccgttt ttccaagtta tgtacgtcaa gacttgggtg ttctctatgc tttctgcaga 240 

gctaccgatg acctgtgcga tgatgaatcc aaatctgttc aagaaagaag agaccaatta 300 

gatcttactc gacaatttgt tcgtgatctc tttagccaaa agaccagtgc gcctattgfcg 3 60 

attgattggg aattgtatca aaaccaactfc ccfcgcttctt gtatatcagc ctttagagcc 420 

tttactcgcc ttcgccatgt ccttgaagta gaccctgtag aagaactatt agatggttac 480 
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aaatgggatc ttgagcgtcg tcctatcctt gatgaacaag acttggaggc ataatctgct 540 

tgtgtggcca gtagfcgtggg tgaaatgtgc acacgtgtga ttcbtgcfcca agaccaaaag 600 

gaaaatgatg cttggataat tgaccgtgca cgtgagatgg ggctggtgct acaatacgtt 660 

aacattgctc gagacattgt gactgatagc gagactctgg gtcgatgtta tctgcctcaa 720 

caatggctta gaaaagaaga aacagaacaa atacagcaag gcaacgcccg tagcctaggt 780 

gatcaaagac tgttgggctt gtctctgaag cttgtaggaa aggcagacgc tatcatggtg 840 

agagctaaga agggcattga caagttgccjg guaadctgtc aaggcggtgt acgagcfcgct 500 

tgccaagtat atgctgcaat tggatctgta ctcaagcagc agaagacaac atatcctaca 960 

agagctcatc taaaaggaag cgaacgtgcc aagattgctc tgtfcgagfcgt atacaaccfcc 1020 

tatcaatctg aagacaagcc tgtggctctc cgtcaagcta gaaagattaa gagttttttt 1080 

gttgattag !089 

<210> 69 
<211> 611 
<212> DNA 

<213> Blakeslea trispora 
<400> 69 

agagataaaa taaaaagaga agaaaagaaa gtttgtacaa tttctttttg tttatataac 60 

atacacgcta tgtcaacatt tagaataagg gggaaaaaat cttccatcat atfecgaatgc 120 

acaagattat ttctttgttc gctctttttg gtcgggtcat cgagatttag agtgtaatca 180 

aagat&ctgt catctcgaga gcgttgaaaa ggctgatgtt tgcoaaattg gatgttfegec 240 

gaattagtaa aatacgcaag catttcttac ctttccgctc cctttfcccta afctcfccccaa 300 

agactaaatg aggaaagata aaggacaaag aaaatgtaaa gacaaagaaa ttgaaaacga 3 60 
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tataaacttg cagcacgtaa gaccaaagca aattggtaac tattcttgtg tacaaacatg 420 

tataaaaaaa aacttttttt tgctcctgga ggacaaaatt tcaaactcct tgaagaagat 480 

tgcttgtata tctatcafcat gcatatatca tatcgatgga aaaagaaagt: caggcatgta 540 

tttataaaaa gaagaatgtg ccatgcttcc gaatttcttt tcactttctt ttccttatct 600 

atttfcsatct c 611 

<210> 70 
<211> 882 
<212> DNA 

<213> Haexnatococcus pluvialis 
<400> 70 

atgctgtcga agctgcagtc aatcagcgtc aaggcccgcc gcgttgaact agcccgcgac 60 

atcacgcggc ccaaagtctg cctgcatgct cagcggtgct cgttagttcg gctgcgagtg 120 

gcagcaccac agacagagga ggcgctggga accgtgcagg ctgccggcgc gggcgatgag 180 

cacagcgccg atgtagcact ccagcagctt gaccgggcta tcgcagagcg tcgtgcccgg 240 

cgcaaacggg agoagctgtc ataccaggct gccgccattg cagcatcaat tggcgtgtca 300 

ggcattgcca tcttcgccac etacctgaga tttgccatgc acatgaccgt gggc ggcgca 360 

gtgccatggg gtgaagtggc tggcactctc ctcttggtgg ttggtggcgc gctcggcatg 420 

gagatgtatg cccgctatgc acacaaagcc atctggcatg agtcgcctct gggctggctg 480 

ctgcacaaga gccaccacac acctcgcact ggaccctttg aagccaacga cttgtttgca 540 

atcatcaatg gactgcccgc catgcfccctg tgtacctttg gcttctggct gcccaacgtc 600 

ctgggggcgg cctgctttgg agcggggctg ggcatcacgc tatacggcat ggcatatatg 660 

tttgtacacg atggcctggt gcacaggcgc tttcccaccg ggcccatcgc tggcctgccc 720 

tacatgaagc gcctgacagt ggcccaccag ctacaccaca gcggcaagta cggtggcgcg 7 SO 
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ccctggggta tgttcttggg tccacaggag ctgcagcaca ttccaggtgc ggcggaggag 840 
gtggagcgac tggtcctgga actggactgg tccaagcggt ag 882 

<210> 71 
<211> 528 
<212> DiSEA 

<213> Erwinia uredovora 
<400> 71 

atgttgtgga tt'tggaatgc cctgatcgtt ttcgttaccg tgattggcat ggaagtgatt 60 
gctgcactgg cacacaaata catcatgcac ggctggggtt ggggatggca tctttcacat 120 
catgaaccgc gtaaaggtgc gtttgaagtt aacgatcttt atgccgtggt ttttgctgca 180 
ttatcgatcc tgctgattta tctgggcagt acaggaatgt ggccgctcca gtggattggc 240 
gcaggtatga cggegtatgg attactctat tttatggtgc acgacgggct ggtgcatcaa 300 
cgttggocat tor.gnt-.atat tccacgcaag ggctacctca aacggttgta tatggcgcac 360 
cgtatgcatc acgccgtcag gggcaaagaa ggttgtgttt cttttggctt cctctatgcg 420 
ccgcccctgt caaaacttca ggcgacgctc cgggaaagac atggcgctag agcgggcgct 480 
gccagagatg cgcagggcgg ggaggatgag cccgcatccg ggaagtaa 528 

<210> 72 
<211> 762 
<212> DKA 

<213> Wostoc sp. PCC73102 
<400> 72 

atgatccagt tagaacaacc actcagtcat caagcaaaac tgactccagt actgagaagt 60 
aaatctcagt ttaaggggct tttcattgct attgtcattg ttagcgcatg ggtcattagc 120 
ctgagtttat tactttccct tgacatctca aagctaaaat tttggatgtt attgcctgtt 180 
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atactatggc aaacattttt atatacggga ttatttatta catctcatga tgccatgcat 240 

ggcgtagtat ttccccaaaa caccaagatt aatcatttga ttggaacatt gaccctatcc 300 

ctfctatggtc fctttaccata tcaaaaacta ttgaaaaaac attggttaca ccaccacaat 360 

ccagcaagct caatagaccc ggattttcac aatggtaaac accaaagttt ctttgcfctgg 420 

tattttcatt ttatgaaagg ttactggagt tgggggcaaa taattgcgtt gactattatt 480 

tataactttg ctaaatacat actccatatc ccaagtgata atctaaetta cttttgggtg 540 

ctaccctcgc tLUtaagttc attacaatta ttctattttg gtactttttt accccatagt SO0 

gaaccaatag ggggttatgt tcagcctcat tgtgcccaaa caattagccg tcctatttgg 660 

tggtcattta tcacgtgcta tcattttggc taccacgagg aacatcacga atatcctcat 720 

atttcttggt ggcagttacc agaaatttac aaag'caaaat ga 762 

<210> 73 
<211> 617 
<212> DNA 

<213> Haematococeus pluvialis 
■ <400> 73 

tagggtgcgg aaccaggcac gctggtttca cacctcatgc ctgtgataag gtgbggctag 60 

agcgatgcgt gtgagacggg tatgtcacgg tcgactggtc tgatggccaa tggcatcggc 120 

catgtctggt catcacgggc tggttgcctg ggtgaaggtg atgcacatca tcatgtgcgg 180 

ttggaggggc fcggcacagtg tgggctgaac tggagcagtt gtccaggctg gcgttgaatc 240 

agfc^aggg-fct tgtgattg-go ggt tgrtgaag- caatgaotcc gcccatattc tafcfctgfcggg 30f> 

agctgagatg atggcatgct tgggatgtgc atggatcatg gtagtgcagc aaactatatt 360 

cacctagggc tgttggtagg atcaggtgag gccttgcaca ttgcatgatg tactcgtcat 420 
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ggtgtgttgg tgagaggatg gatgtggatg gatgtgtatt ctcagacgta gaccttgact 480 
ggaggcttga tcgagagagt gggccgtatt ctttgagagg ggaggctcgt gccagaaatg 540 
gtgagtggat gactgtgacg ctgfcacattg caggcaggtg agatgcactg tctcgattgt 600 
aaaatacatt cagatgc 617 



<210> 74 
<211> 1208 
<212> DWA 

<213> Haematococcus pluvialis 
<400> 74 

60 



120 
180 



attgtgactg atagcgagac tctgggtcga tgttatctgc ctcaacaatg gcttagaaaa 
gaagaaacag aacaaataca gcaaggcaac gcccgtagcc taggtgatca aagactgttg 
ggcttgtctc tgaagcttgt aggaaaggca gacgctatca tggtgagagc taagaagggc 

attgacaagt tgccggcaaa ctgtcaagge ggtgtacgag ctgcttgcca agtatatgct 240 

gcaattggafc ctgtactcaa gcagcagaag acaacafcatc ctacaagagc tcatctaaaa 300 

ggaagcgaac gtgccaagat tgctctgttg agtgtataca acctctatca atctgaagac 360 

aagcctgtgg ctctccgtca agctagaaag. attaagagtt tttttgttga ttagtgaatt 42 0 

tttgttttat ttatgtctga tagttcaata aagagacaac acatacaata taaaatcatt 480 

gtctttaaat gttaatttag tagagtgtaa agcctgcatt ttttttgtac gcataaacaa 540 

tgaattcacc ccgcttctgg tttttaaata attatgtcaa actagggaaa atfcctttttt 600 

ttctcttcgt Lctttttfctg gcttgttgtg gagfccaeagg attgtcfefcoa gattgataga 660 

ggttgtatac actcaacaga gcaatcttgg cacgttcgct tccttttaga tgagctcttg 720 

taggatatgt tgtcttctgc tgcttgagta cagatccaat tgcagcatat acttggcaag 780 
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cagctcgtae acegccttga cagtttgccg gcaacttgtc aatgcccttc ttagctctca 840 

acatgatagc gtctgccttt cctacaagcfc tcagagacaa gcccaacagfc ctttgatcac 900 

ctaggctacg ggcgttgcct tgctgtattt gttctgtttc ttcttttcta agccattgtt ■ 960 

gaggcagata acatcgaccc aacatcctcg agccafcacta cagcataaaa ggatacgttt ' 1020 

tcttfcaanag aaatttaccc ttttgttatc agcacataca aaaaaaaaga aatttaagat 1080 

gagtaggact tccattctct caaaaatttt attcaatcca taaatgaatt atttttggac 1140 

aaaaaagaaa gattatgccfc gattttctct attttttttt tttttacaac tccaccaata 1200 

ctttctag 1208 



<210> 75 

<211> 6316 

<212> UNA 

<213> Blakeslea trispora 



<220> 

<221> misc_£eature 

<222> (2694) .. (2694) 

<223> n is a, c, g, or t 

<220> 

<221> misc__feature 

<222> {4263) .. (4263) 

<223> n is a, c, g, or t 

<400> 75 

aaggatgaag aatccaactc taataaaaat cttatggata tctttgatcg actcaaaaag 60 

gcfctfccaafcg ctatfcgcfcat taaoaaaaaa gagagagaga gaactatgag caaaaggaafc 12 0 

ctatgccaag atggcaaaaa ggcaccagaa acccttagtt tattattgca taatccagtc 180 

gagctagfcac ttctgtagct caagcttaac cgaggatctt ggaatcaact cgtctcgtca 240 
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ctcttgccga tgatcctaga aatggtafcct atggatgtta tactaacatt gttatctttc 300 

aaggcctcga agatgttatt gttgcggtga taaataggct gctatgtact gaagttgctc 360 

tgtaaaatga atctagttca ctgcctactc agcaaatggt tgtttctaat gtctttaaag 420 

aaagaaaaaa agatacatat agactaccct tcctttcaag actgtaatcg agaatcggcc 480 

gatggtfctat tacaattaga cgctgggaat aagcaaaagg attcatcttt gtaaataaga 540 

gactggtgca hatgaaagca aggatcgfcat caaggaatag ttttgatcga gcatcaccag 600 

caaatgctgc taatgttggc ttcttctttg cttcctgaga ttgaatggga tgfcgcctaga 660 

gcattgctat tttfcaagtgt atactttaga tttgtgtctt tagatttgfcg tcattttatt 720 

tagtcaagaa agatccccct ttctctatgt atgctaagaa gaaggagcaa gaagtgtatt 780 

tacaagttgg aatgagattg aaatattgta cataataata ataaaaagaa aggtagatca 840 

aaaaaaatgt tctgcctatt gtaagaaatc gggaccaaca ggtgctfcgat aaccagaagb 900 

agr.t-.hrcaat fccaggtagag gcfcctaggga caaatacaca attatgacag gaattttctt 960 

gttgacttga acactacaag agaaacgggt cagcacaaaa tccgaaaaaa aaaagaaacg 1020 

gaccattcat gtcttaccta tctagctctt tgtcttcaat tgcatcccat tgctcaacca 1080 

cagatacgct tcccaattga gtatattgat gaagtgttcc ctgcattttt cgcttgacta 1140 

atfcccactac agtcacagtc ttattaatgt tttgtccttt accagtcagg ataatatgat 1200 

ctttttgctt cttctatcaa aaaaataatt cttgttttga ataaaaaaaa caaatattta 1260 

aagaaactac ttfcgatgacg gtacctggaa taactcgaga cacacatcta catatgcgtt 1320 

gatttbattg tggotaafcta gaaectcafct ttcfcgcfcggt gggggafcgfcfc gactttcagfc 1380 

tgctgagacg tccttcttgc ttcttttata gtcttccact atgattttaa tcaagaaagt 1440 

aagtcagtga tgattgttac aagctatata tcttgaaaaa 'gaacagagag gtattattat 1500 
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cagatgcaac atggtttfcct gtatcatttt catttcagtt tctctgttca aaaaaaaaaa 1560 

gaacactttc tctttccact cctcaaattt tttctgctaa actcctcgca aaacatgtat 1620 

ttgctttaaa ctacaagttg caattgtctg atttagcaat ttcaatatgc cttttgtgaa 1680 

tccacccaaa aataaacaag tgcttgagta tacttgggtt cagttcaaaa gaaagcaagc 1740 

tttttttttt cfcttcttggg aaagaaaaaa aaatattgtt gagccatcct ttaccagcag 1800 

fcatgcgagct acgacatagc fcggtctaaca atgactgcaa gcaatagatc gagcttagtc I860 

tfctcfcattgc ttcyttgttt gatctatgtt cggccttacg ctgacctatc caatactcga 1920 

gataggcaac aagatttcga acagtaatga aataaatttc ggataacagt tgtggatgag 1980 

gaagagaaag cgacttgaac tcgagaaact ttgttgaaat gaaatccgac cttttacgtg 2040 

atcatcatgt attatcctct ttttcttttt tttcgtagtg aattacttac tgattgcgct 2100 

caagtcgcgt ctttataaag aagaaaaaaa aatattagaa ctttcaaaaa atataactga 2160 

aaataaaagt gtggctcgga gagcaaatac cacatccttt gtcttcgctt tggtaacacg 2220 

gttaataagc cactataggt gaataatgat catttctgag aataaagcgc ggcttgaagc 2280 

ttatatccat atcaggattc atattaggca caactcacaa ttgaggttcc agaagtgcca 2340 

attttttttt cctgatagcc tgtccaatta agatcaaaaa ccactgagtt ttctctatat 2400 

attttttttt ttcataattc ttaactcttc ttcctctctc tctctctcte tctctttttg 2460 

gcfctgcaaaa aaaatcttta gtaataccaa agaaagcaaa acttttcctt ttcttatttc 2520 

cttgcttgtt ttttaatttfc fcgafcttctct atgctfctaaa tacacatttc tttcttfcctt 2580 

ctgctattac ctatcttttc attcctctcc cccctctctc tcttggtcta taaacatcat 2640 

gaagtcctct tttaaaagtt cgcttgacat ttatgctgtt tatatacagc atcntgtgtt 2700 

ttccaagtgg ttcattcttg cttttgttct ttcgattttc ctcaacactt atctactgaa 2760 
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cgcttcgaag caacagccca aagtgataat caaaaaggtt attgagcggg tagaagtacc 2820 

aagtagagaa caacctaaat cagtcataaa gccctcctcc aagaaacact cttctcatca 2880 

tcagtctgat gtcattcgcc ctcttgatga agtattgggt ttgctcggaa cacccgaggc 2940 

cttgactgat gaagagatca tctctattgt tcaagctggt aaaatggccc cctatgctct 3000 

tgaaaaggtc ttgggcgatt tagagcgcgc tgtccatatc cgtcgtgctt tgatctcccg 3060 

tgactcfccgt acgaaaactt tggaagacag tatgcttccc gtgaaaaact atcattatga 3120 

taaagtcatg ggtgcLtgLt yty acted LyL ectttggttat atgcctattc cagtetggtgt 3180 

cgcaggtaag aagttcaaca agtcgcgata tttgacaagt tgotcatcat tttcgaaaca 3240 

ggfccctttgg tgattgatgg tgafctcfcatt catattccca tggcaactac ggaaggttgt 3300 

ttagttgctt ctactgccag aggfctgtaaa gcaafccaatg ctggtggtgg tgccaacaca 3350 

ahtgttgttg ctgatggtat gactcgaggt ccttgtgtcg aatttcctac aatcactcgc 3420 

gctgctgact gtaaacgatg gattgaacaa gagggtgaag ctatcgtgac cgaggcattc 3480 

aattcaactt ctcgttttgc tcgtgttcgt aaattgaaag ttgctcttgc cggtcgtcta 3S40 

gtctacatcc gtttctctac cactacaggt gatgcaatgg gcatgaacat gatctccaag 3600 

ggttgtgaaa aggctttaag caagattgct gagagatatc ctgatatgca gatcatttct 3660 

ctttctggta actattgtac tgacaagaaa cctgct'gcta tcaactggat tgaaggacgt 3720 

ggtaaatctg ttgttgctga sgctgtcatc cctggtacgg ttgtcgaaaa ggfcattgaag 3780 

acctctgtta gtgctttggt tgagctgaac atctctaaaa acctggttgg ttctgctatg 3840 

gctggctccg tcggtggctt taacgctcat gctgctaata ttctaactgc catttacctt 3900 

gctactggtc aagatcctgc tcaaaatgta sagagttcta actgtattac tttgatgaaa 3960 

gctgtcaatg gcgaaagaga ccttcatatc tcttgtacaa tgccctgtat tgaagtaggc 4020 



WO 2004/063358 PCT/EP2004/000100 
351/358 

accafctggtg gtggtactat tttgcctcct caacaagcca tgttggattt cattggtgtg 4080 

cgtggtcctc accctaccga acctggtgcc aatgcccgwc gccttgctcg tgttatctgt 4140 

gcctctgtga tggctggtga attgtctfcta fcgtgcagctt tggctgctgg tcatcttgta 4200 

aaggcacaca tggctcataa tcgtaatacc actgctgctg ccgctgttgt tcctgcccct 4260 

aanggcatag ttgatgtctc tacacctcct gctacacctg cagaaaagaa tgatcctatfc 4320 

cctggaagtt gtatcaagtc atagaattaa tatfcatatat atatcatafea caaaaaaaag 4380 

aaaaaaaaaa cactacatct atttatattt uUccatgtac acaoacacac acacatataa 4440 

aaactcttta ttttccaata ttttgctttt ataaataatc ttatttcatt ctaaataaac 4500 

tgtttttttt tattaatcat caaaccctgc tgagagctgt gcaatatcat ctatgttttc 4560 

atggfcttaac tctggtatcg gwcgagcctc ctctgtactt gaagtttgta ggcagtfcttt 4620 

atttaaggct gctggtcgat catgatcatc akcaaacctg acagcatgaa gttttgactg 4680 

atgagcaatt tcactaaggg cagaatctga actctttcgc ttcctactat tgaccatatt 4740 

gtctttaggt ggaatgagtg aatagcgtct tgtcatatgt aacacagaat caacaatatc 4800 

ctggtgatga aactcggcca aacatagcgc ctttctcccc caacaattat aataatcaaa 4660 

atgagaatga catgtacggt tttcctcgat gacaatatcc aacgtcttgt cataatcetc 4920 

tgtgcgyata ccattcatct tttggaagaa cgcacggtag ctctcacaag ctgtcctcag 4980 

agagttccgt gccatgtttc ccaatgctcc tggcaagtcg aaatgaagtt gtcgaatctg 5040 

gcgatgtatg tcfcacaatgt cgcctgtttc fcttcattaga tcaagcattc gtgtagccca 5100 

aatgatgtct atgttatgat tttctttcat tccagtaata actatagttt ctcggcaaat 5160 

cgaatgastg atggagtaaa ttcatcaaaa gtgcaagtaa tacatacagt gcttgaagaa 5220 

atcttgtgta gcacgcctat attatgtaat ataggatcga ttctcgaaac tcgacataac 5280 
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caccaggctt tagcaagcgt tttatttcat tcatgacaag ctattgttaa ttcytgctta 5340 

ataaaacaaa atgaaaaaaa catacccccc tcmaaactta cttcccactc ttgattggaa 5400 

aaacaggtat agacgtgacg catatgtata taatcaaaac actcatcagg atagggtaaa 5460 

ccattgagca catcgcattg ggtgaagaaa gtattaggag gcttgatggc tgtaggatat 5520 

ataggtgcaa tatcaatacc gtaaaactca gcatttggga afctctgfcagc catctccaga 5580 

atccaagtac ctgtgccaca agcaacatca agcactttag gtaagggtat acattgttgt 5640 

tcttgttgtt gttgttgaca atcscttgag tcfcg&gbfctc gfcfctfcgattg tfcttaatgac 57 O0 

aataattctt ttacaggtgc tgagaaatta ccgtcaaata gatacttgta aataaaatgc 5760 

taaaaataaa aacaatagaa aaaaaaattg acgctcattt cattactatg gaaataacfcg 5820 

caaaafccfcfca ccacttgtac aagtctatct tgctcaatct cafccgtttgg cagaatgtafc 5880 

fcfcattcrttgt agtattqata tcttctacca ttcatgatat aactgtcgct tctaatgctc 5940 

tgaggtgaag tacttgtagg tgaaggtgga agtgacgcaa ttttgtcaag cttaacagga S000 

tcctctcggc tacatgtttt ctgcatatca ggaaaatctt gtttatttga aacatcaaca 6060 

gtagatgtgg tgtgatcttt tttgaaaata tcgatgcctt cctttgaaag ccttttgaaa 6120 

ggctctttta acttttttga gtgagagcta cccatgatag cttatgaaga attaaaaaga 6180 

aaaaagcaaa aaaaattaaa aaaaaaaaaa gtagcaaaaa attctgtcgt aattatacaa 6240 

gccaatcaaa atcgaaattc atgcaaggca tagatgtfcca cgtggatttg atggttgatc 6300 

etttfcttttt goaaga 6316 



<210> 76 
<211> 1170 
<212> DKTA 
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<213> Thermus thermophilus 
<400> 76 

atgaagcgcc tttccctgag ggaggcchgg ccctacctga aagacctcca gcaagatccc 60 

ctcgccgtcc tgctggcgtg gggccgggcc cacccccggc fccttccttcc cctgccccgc 120 

ttccccctgg ccctgatctt tgaccccgag ggggtggagg gggcgctcct cgccgagggg 180 

accaccaagg ccaccttcca gtaccgggcc ctctcccgcc tcacggggag gggcctcctc 240 

accgactggg gggaaagctg gaaggaggcg cgcaaggccc tcaaagaccc cttcctgccg 300 

aagaacgtcc gcggct&ccg ggaggccafcg gaggaggagg oocgggcctt cfcfccggggag 3 60 

tggcgggggg aggagcggga cctggaccac gagatgctcg ccctctccct gcgcctcctc 420 

gggcgggccc tcttcgggaa gcccctctcc ccaagcotcg cggagcacgc ccttaaggcc 480 

ctggaccgga tcatggccca gaccaggagc cccctggccc tcctggacct ggccgccgaa 540 

gcccgcttcc ggaaggaccg gggggccctc taccgcgagg cggaagccct catcgtecac 600 

ccgcccctct cccaccttcc ccgagagcgc gccctgagcg aggccgtgac ccfccctggtg 660 

gcgggccacg agacggtggc gagcgccctc acctggtcct ttctcctcct ctcccaccgc 720 

ccggactggc agaagcgggt ggccgagage gaggaggcgg ccctvgucgc uttcuaggag 780 

gccctgaggc tctacccccc cgcctggatc ctcacccgga ggctggaaag gcccctcctc 840 

ctgggagagg accggctccc cccgggcacc accctggtcc tctcccccta cgtgacccag 900 

aggctccact tccccgatgg ggaggccttc cggcccgagc gcttcctgga ggaaaggggg 960 

accccttcgg ggcgctactt cccctttggo cfcggggcaga ggctctgcct ggggcgggac 1020 

ttcgccctcc tcgagggccc catcgtcctc agggccttct tccgccgctt ccgcctagac 1080 

cccctcccct tcccccgggt cctcgcccag gtcaccctga ggcccgaagg cgggcttccc 1140 

gcgcggccta gggaggaggt gcgggcgtga 1170 
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<210> 77 
<211> 2981 
<212> DNA 

<213> Blakeslea trispora 
<400> 77 

tctagaattc attccattcg aaaggatcaa cataaccaat fctaatgacta ctagctaatg 60 

gatacaaata tacgcacaaa aaaagaaaga attctatgat caaagagaac acagacacag 120 

agtgatacat ttaaatggtt aagttcttat gatgttaaaa tggtaacttt attattgaafc 180 

taaatgcgaa tatcgttgct gctttgtact tggaaaacgt taggtaaaag ttggttaatg 240 

aaagaagcag gagttgtagt atcatctctt gggaagaaat agaaaaagag gaaagtaaca 300 

aagtaacaag caagacaata atagatccaa tggctttcgg tcttacgagt ttgttcagga 360 

gcatacttct tttggctatc ttgtaacttt cttggtaagg gattctggcc aaagctttta 420 

cagacttggt cggaagtaag cttacttcca gcaagaacga taggaacacc agtacctgga 480 

tgtgtactac aaagaaaaga gaaatgagta cgtgcgttat baaaaaaaag aaaaaaagag 540 

ggcaaaagta ttacctagct ccgacaaaga aaagattatc ataacggttt gtggaatcct , 600 

tggtactagg tctgaaccag agaacttgga acacatcatg agaaagacca agaatagaac 660 

ctctccaaag gttaaacttg ctttgccaaa cactaggatc attcacttct tcatgttcaa 720 

tcaaattagc aaagttgttt actcccaaac gacgfctcgat aacttccaga accatcttgc 7 80 

gtgcacggtt taccaactca ggataatttt cttcagcact gtttcctgfcc ttactcttca 840 

tatggccaafc tggaaccaac acaafcaatgg agtcctfcgtt gggaggtgcg gcagattcat 900 

caatfccgaga tggaacgttg acatagaatg aagcttcaga gggcaaaccg aagtcgttga 960 

aaatctcatc aaaactttcc ttgtaggctt cagccaagaa gatattgtgt acgtctaatt 1020 



WO 2004/063358 PCT/EP2004/000100 
355/358 

gaggcacctt tgttgacatg gaccaataaa acgaaataga fcgatgaagtg agtttctttg 1080 

aggctaatgt cttctttgtc caattgcaag gaggtaacag atggtgataa gcataaacaa 1140 

gatccgcatt acatacgact gcatcggctt caatgacttc tccgcttfccc aaagtgacac 1200 

cggttacacg cttgtcttta tcgacagtgt taattttagc aacaggcgat tgatatctga 1260 

attcagcacc gtactttttg gaggcgatag actcaagctt ctgaacaacc atgttgaaac 1320 

caccacgagg ataccagata ccttcagcaa actcggtgta ttgtaacaaa ctgtaaactg 1380 

ctggagcatc at&aggcgac ata.ctata.fct ccaaaaatag aaaatagaac aatgaatatc 1440 

aaaattcctt tcacttgccc tttttcacat ttctcttttc ccacccccga ccggtctcac 1500 

tcattttttt ttcatcccac accacgcgtt gtatgtgfcac ttaccccata tacattgttt 1560 

gaaaagtaaa agccatacgc attttcttgg tttggaaata tttactggct cggtcataga 1620 

tcttaccaaa caagtgcaag cgaaagattt caggcacata ctgaagacga ateaaatccc 1680 

aaatggtttc aaagttgcgc ttgatagcaa taaatgtacc ttgttcataa tggacatgtg 1740 

bttccttcat gaaatccaag aatctaccaa atccaagggg acccfccaafca cggtccaafct 1800 

cgcccttcat cttggttaaa tcggaagaga gttgtacggc atcaccgtcg tcaaaatgaa 1860 

ccttatagtt attgfccacag cgaagcaaat ccaaatgatc aacaatacgt tcatccaaat 1920 

cagcaaatgc atcttcaaaa agcttaggca tcaaatagag tgagggaccc tgatcaaagc 1980 

gatgaccatc gbgatgaatg aatgaacaac ggccaccgga aaagtcgttc ttttcaacaa 2040 

cagtaactcg aaaaccttca cgagcaagac gagcagcagt agcagttccg ccaataccgg 2100 

caocaatgac aacaatatgc ttcttttgat cagacatgag attaaaatag ataaggaaaa 2160 

gaaagtgaaa agaaattcgg aagcatggca cattcttctt ttfcataaata catgcctgac 2220 

tttctttttc catcgatatg atatatgcat atgatagata tacaagcaat cttcttcaag 2280 
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gagtttgaaa ttttgtcctc caggagcaaa aaaaagtttfc tttttataca tgtttgtaca 2340 

caagaatagt taccaatttg ctttggtctt acgtgctgca agtttahatc gttttcaatt 2400 

tctttgtctt tacattttct ttgtccfctta tctttccfcca tttagtcttt gggagaatta 2460 

ggaaaaggga gcggaaaggt aagaaatgct tgcgtatttt actaattcgg caaacatcca 2520 

atttggcaaa cagcagcctg tgcaacgctc tcgagatgac agtafcctttg attacactct 2580 

aaatctcgat gacccgacca aaaagagcga acaaagaaat aatcttgtgc attcgaatat 2640 

gatggaagat tttttccccc ttattctaaa tgfctgac&fca gcgtgfcatgt tatataaaoa 2700 

aaaagaaatt gtacaaactt tcttttcttc tcttfcttatt ttatctctat gtcaatactc 2760 

acttafcctgg aatttcatct ctactataca ctacctgtcc ttgcggcatt gtgttggctg 2820 

cfcaaagccgt ttcactcaca gcaagacaat ctcaagtata aatttttaat gtfcgatggcc 2880 

gcctctaccg catcgatttg ggacaattat atcgtttatc atcgcgcttg gtggtactgt 2940 

cctacttgtg ttgtggctgt cattggctat gtacctctag a 2981 

<210> 78 
<211> 1749 
<212> DNA 

<213> Blakeslea trispora 
<400> 78 

afcgfcctgatc aaaagaagca tattgttgtc attggtgccg gtattggcgg aactgctact 60 

gctgctcgtc ttgctcgfcga aggttttcga gttactgfctg ttgaaaagaa cgacttttcc 120 

ggfcggocgtt gttcatteat hMtcacgat ggtcatcgct ttgatcaggg tccctcactc 180 

tattfcgatgc ctaagctttt tgaagatgca tttgctgatt tggatgaacg tattggtgat 240 

catttggatt tgcttcgctg tgacaafcaac tataaggttc attttgacga cggtgatgcc 300 
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gtacaactct cttccgattt aaccaagatg aagggcgaat tggaccgtat tgagggtccc 360 

cttggafcttg gtagattctt ggatttcatg aaggaaacac atgtccatta tgaacaaggfc 420 

acatttattg ctatcaagcg caactttgaa accatttggg atttgattcg tcttcagtat 480 

gtgcctgaaa tctttcgctt gcacttgttt ggtaagatct atgaccgagc cagtaaatat 540 

. ttccaaacca agaaaatgcg tatggctttt acttttcaaa caatgtatat gggtatgtcg 600 

ccttatgatg ctccagcagt ttacagtfctg ttacaataca ccgagtttgc tgaaggtatc 660 

tggtatcctc gtggtggttt caacafcggtt gttcagaagc ttgagtctat cgcctccaaa 720 

aagtacggtg ctgaattcag atatcaatcg cctgttgcta aaattaacac tgtcgataaa 780 

gacaagcgtg taaccggtgt cactttggaa agcggagaag tcattgaagc cgatgcagtc 840 

gtatgtaatg cggatcttgt ttatgcttat caccatctgt tacctccttg caattggaca 900 

aagaagacat tagccfccaaa gaaactcact tcatcatcta tttcgtttta ttggtccatg 960 

tcaacaaagg tgcr-fcc-aatt aoacgtacac aatatcttct fcggctgaagc ctacaaggaa 1020 

agttttgatg agattttcaa cgacttcggt ttgccctctg aagcttcafct ctatgtcaac 1080 

gttccatctc gaattgatga atctgccgca cctcccaaca aggactccat tattgtgfctg 1140 

gttccaattg gccatatgaa gagtaagaca ggaaacagtg ctgaagaaaa ttatcctgag 1200 

ttggtaaacc gtgcacgcaa gatggttctg gaagttatcg aacgtcgttt gggagtaaac 1260 

aactttgcta atttgattga acatgaagaa gtgaatgatc ctagtgtttg gcaaagcaag 1320 

tttaaccttt ggagaggttc tattcttggt ctttctcatg atgtgttcca agttctctgg 1380 

ttcagaecta gtacoaagga fctccacaaac ngtfcatgata atcttttctt tgtcggagct 1440 

agtacacatc caggtactgg tgttcctatc gttcttgctg gaagtaagct tacttccgac 1500 

caagtctgta aaagctttgg ccagaatccc ttaccaagaa agttacaaga tagccaaaag 1560 
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gtagtatgctc ctgaacaaac tcgtaagacc gaaagccatt ggatctatta ttgtcttgct 1620 
tgttactttg ttactttcct ctttttctat ttcttcccaa gagatgatac tacaactcct 1680 
gcttctttca ttaaccaact tttacctaac gttttccaag tacaaagcag caacgatatt 1740 
cgcatttaa 1749 



<210> 79 

<211> 25 

<212> DNA 

<213> Artificial 

<220> 

<223> Primer 

<400> 79 

ccgatggcga cgacggaagg ttgtt 



<210> 80 
<2ll> 

<212> DNA 

<213> Artificial 

<220> 

<223> Primer 

<400> 80 

catgttcatg cccattgcat cacct 
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